[转]WebRTC学习笔记

转载自:http://blog.csdn.net/zqf_office/article/details/26137213

1.     WebRTC学习

1.1   WebRTC现状

本人最早接触WebRTC是在2011年底,那时Google已经在Android源码中加入了webrtc源码,放在/external/webrtc/,但是Android并没有用到它,更没有被浏览器使用。当时试图在Android 2.3Gingerbread)高通平台的手机上用H.264 硬件codec替换掉WebRTC缺省使用的VP8codec,费了不少劲勉强换掉后效果很差只得放弃。

最近得知Google最新版的Chrome for Android已经支持WebRTC,应老板的要求搭一个手机浏览器上视频通信的demo,为此在网上搜集各种资料,发现经过一年多的发展,国内外研究和使用WebRTC的人明显多起来,可用的demo也很多。在此做一个笔记,留作日后参考。

目前基于WebRTC的开发其实有两个方向,一个是基于浏览器的WebRTC应用开发,编程语言主要是JavaScriptHTML等,这也是WebRTC作为HTML5标准的组成部分原本的目的;另一个是C层面的移植和开发,作为一款非常强大的开源软件,很多领域的软件项目都可以利用到WebRTC的音视频通信和处理能力,这些场合的应用程序可能是C语言写的,也不一定与浏览器有关。本文是属于前一种方向。

1.2   WebRTC基本概念学习

WebRTC的官方资料可以从其官网http://www.webrtc.org/W 3C网站http://www.w3.org/TR/webrtc/上看到。

学习WebRTC基础知识比较好的网站是《Getting Started with WebRTC》,网址是http://www.html5rocks.com/en/tutorials/webrtc/basics/,这个也是官网上推荐的。

对浏览器来说,WebRTC其实就是提供了3API

MediaStream (getUserMedia),用于获取媒体数据,例如来自摄像头和麦克风的视频流和音频流;

RTCPeerConnection,用于peerpeer之间呼叫和建立连接以便传输音视频数据流;

RTCDataChannel,用于peerpeer之间传输音视频之外的一般数据。

需要注意的是这几个API的名称在不同浏览器及同一浏览器的不同版本之间略有差异,比如PeerConnectionFireFox上叫做mozRTCPeerConnection,而在当前版本的Chrome上叫做webkitRTCPeerConnection,将来WebRTC标准化完成后会把这些前缀去掉使用统一的名称。

目前网上找到的WebRTC demo都只用到了getUserMediaRTCPeerConnection这两个API,另一个APIRTCDataChannel似乎目前还不太成熟。

WebRTC是实现peer to peer的实时通信(可以两个或多个peer之间),在能够通信前peerpeer之间必须建立连接,这是RTCPeerConnection的任务,为此需要借助一个信令服务器(signaling server)来进行,信令包括3种类型的信息:

Session control messages: 初始化和关闭通信,及报告错误;

Network configuration: 双方的IP地址和端口号(局域网内部IP地址需转换为外部的IP地址);

Media capabilities: 双方的浏览器支持使用何种codecs以及多高的视频分辨率。

WebRTC并未规定使用何种信令机制和消息协议,象SIPXMPPXHRWebSocket这些技术都可以用作WebRTC的信令通信。

除了信令服务器,peerpeer建立连接还需要借助另一种服务器(称为STUN server)实现NAT/Firewall穿越,因为很多peer是处于私有局域网中,使用私有IP地址,必须转换为公有IP地址才能相互之间传输数据。这其中涉及到一些专业术语包括STUNTURNICE等,具体的本人还有待学习。网上找到的WebRTC demo好象都用的是Google提供的STUN server

peerpeer之间一旦建立连接就可以直接传输音视频数据流,并不需要借助第三方服务器中转。

2.     WebRTC封装库

WebRTC的目的是为了简化基于浏览器的实时数据通信的开发工作量,但实际应用编程还是有点复杂,尤其调用RTCPeerConnection必须对如何建立连接、交换信令的流程和细节有较深入的理解。因此有高人为我们开发了WebRTC封装库,将WebRTC的调用细节封装起来,包装成更简单的API,使开发应用程序更简单。封装库的另一个目的是为了屏蔽不同浏览器之间的差异,例如上面说的API名称的差异。当然,这些库都是开源的,可以根据自己的需要重新修改。

目前网上找到的有两种WebRTC封装库,一个是webrtc.io,网址是https://github.com/webRTC/webRTC.io,上面有详细说明和使用方法,有很多demo使用它;另一个是SimpleWebRTC,网址是https://github.com/HenrikJoreteg/SimpleWebRTC,貌似比webrtc.io用起来更简单。

3.     WebRTC demo试用

网上可以找到一堆WebRTC demo,在code.google.com上也能找到不少WebRTC应用项目的源码。有些demo是直接调用WebRTC API开发的,但大多数是调用上述两种WebRTC封装库开发的。由于WebRTC API的名称在不同浏览器及同一浏览器的不同版本之间存在差异,所以不是所有demo都能运行在所有浏览器上。

为了找到一个可在公司局域网环境中跑在手机上的WebRTC demo,本人试用了不少demo,下面选几个有代表性的介绍,其中有两个经修改后已在本人公司的局域网环境中运行成功。

先说一下本人的测试环境:手机上的浏览器是Chrome for Android 26.0.1410.49,运行在Android 4.1.2上,这个Chrome版本本身是beta版,支持WebRTC但缺省是关闭WebRTC功能的,需要在chrome://flags中使能WebRTC并重启Chrome,或者在启动Chrome时增加命令行选项--enable-webrtc。本人在PC上运行WebRTC的浏览器是Chrome 26.0.1410.43,操作系统是Windows 7

3.1  http://www.webrtc.org/demohttps://apprtc.appspot.com/

这是官方的demo,功能很全,可惜不知为何https://apprtc.appspot.com/这个网址已经连不上了,不过其源码还是可以下载到的,在https://code.google.com/p/webrtc-samples/。此demo没有用任何封装库。

这个demo所使用的信令机制使用了XHRGoogle App Engine Channel API,具体我不懂。

在我的公司局域网环境里无法运行该demo

3.2   爱立信实验室开发的WebRTC demo

据说是第一个基于浏览器的WebRTC视频通信demo,爱立信为此还开发了一个浏览器用于支持WebRTC,好象也是基于WebKit的,叫做Bowser browser(当时市场上可能还没有支持WebRTC的浏览器),该项目网址是https://labs.ericsson.com/apps/bowser。这个Bowser browser好象只支持Ubuntu 11.04 and 11.10(见https://labs.ericsson.com/apis/web-real-time-communication/downloads)。

demo的网址是http://webrtc.labs.ericsson.net:8082

在我的公司局域网环境里无法运行该demo

3.3  人脸检测识别

利用WebRTCgetUserMedia从摄像头获取图像进行人脸识别的demo,例如这两个:

http://neave.com/webcam/html5/face/

http://www.raymondcamden.com/demos/2012/mar/29/test1.html

这两个demoPC和手机上的Chrome上都可运行。

3.4   http://www.simpl.info

这个demo演示HTML, CSS and JavaScript的各种feature和使用方法,包括WebRTC3APIgetUserMediaRTCPeerConnectionRTCDataChannel的演示,但遗憾的是RTCPeerConnection的演示只是本地camera的画面传回给本地,并没有实现真正的设备之间音视频通信。

该项目的源码在https://github.com/samdutton/simpl

3.5   Framegrabber

这是一个基于WebRTC实现屏幕共享(screensharing)的Chrome扩展,源码在https://github.com/samdutton/rtcshare,有关介绍可参考这篇文章:http://blog.sina.com.cn/s/blog_51396f890102es7k.html

本人没有试用过。

3.6   http://webrtc.dennis.is

这个demo是基于库webrtc.io实现的,是webrtc.io官方的demo,使用WebSocket作为信令手段。

在我的公司局域网环境里无法运行该demo;在家里无线路由器环境下可成功运行,但只能单向传输视频。

3.7   http://v.kainy.cn

国内牛人做的,相当于是汉化版的http://webrtc.dennis.is,自然也是基于webrtc.io实现的,但使用的webrtc.io版本较老,不支持新版本Chrome所使用的API名称webkitRTCPeerConnection,所以无法在新版本Chrome上运行。具体介绍在http://blog.kainy.cn/2013/01/webrtc实现的视频聊天室应用/

3.8   http://conversat.io

这个demo是基于库SimpleWebRTC实现的,是SimpleWebRTC官方的demo,使用WebSocket作为信令手段。

在我的公司局域网环境里无法运行该demo;在家里无线路由器环境下可成功运行,且可双向传视频,支持多个peer同时视频通信。

经修改后在本人公司局域网成功运行,试过两个手机和一个笔记本电脑同时视频通信OK。修改和运行步骤:

1.     http://www.nodejs.org/download/下载nodejs最新版并安装,我是在Windows7 64位上安装的;

2.    在命令行下依次运行如下命令(安装运行signaling server所需的模块):

npm install express

npm install yetify

npm install getconfig

npm install node-uuid

npm install socket.io

3.     https://github.com/andyet/signalmaster下载信令服务器源码,该信令服务器是SimpleWebRTC缺省使用的,解开该源码后运行node server.js,该服务器监听8888端口,通过WebSocket与浏览器通信。

4.     在同一台PC上运行apache server,将从http://conversat.io网站扒下来的文件放到该server上(可在Chrome浏览器中打开http://conversat.io然后鼠标右键单击在菜单中选另存为网页,全部即可),修改其中的index.html  simplewebrtc.js,将其中 url改为'http://10.100.156.83:8888'(其中IP地址是我的PC在公司局域网中的IP地址)。

5.    在同一局域网中的其他设备上打开Chrome浏览器,地址栏输入http://10.100.156.83,输入相同的room名称(随便起)即可开始多方视频通信,也可修改上述index.html中的“var room”一行,设定为固定的room名称,就不需要每次在每个设备上手工输入room名称了。

3.9  国内牛人开发的视频聊天室应用

这个demo是国内牛人赵书剑开发的视频聊天室,基于webrtc.io实现。

该项目源码和文档下载地址是http://ishare.iask.sina.com.cn/f/35083616.html,源码在https://github.com/zsj2145676

经修改后在本人公司局域网成功运行,试过两个手机和一个笔记本电脑同时视频通信OK。修改和运行步骤:

1.     http://ishare.iask.sina.com.cn/f/35083616.html下载webrtc.chatdemo.zip,解压缩,修改其中public\javascripts\client.js中的rtc.connect一行,将实际的服务器地址写进去,例如改为:rtc.connect("ws://10.100.156.83:8001", room);

2.     同上文3.8节步骤12安装nodejs

3.     运行node app.js,注意该demo本身已包含http server,不需要其他的比如apache server

4.    在同一局域网中的其他设备上打开Chrome浏览器,地址栏输入http://10.100.156.83:8000,输入相同的room名称(随便起)即可开始多方视频通信。

Leave a Reply

Your email address will not be published. Required fields are marked *