首页 热点资讯 义务教育 高等教育 出国留学 考研考公
您的当前位置:首页正文

音视频学习从零到整-视频H264编码

2024-12-19 来源:化拓教育网

一.学习背景

5G网络作为第5代的移动通信网络,它的网络峰值传播速度可1以达到10Gbps/s.这比4G的的传输速度快数百倍.举个例子,整部超高画质电影下载可在1秒钟之内下载完成.

当然,随着5G技术的诞生,用在智能终端分享3D电影,游戏或者超高画质节目的时代已经毫无悬念的向我们走来.

想必大家也逐步了解,国内外的互联网公司也已经布局音视频,3D技术方面的开发者招聘和相关产品研发.目前落地推广最普遍的就是直播类项目和小视频类的项目.当然未来的方向肯定不止如此.

那么我们现在带着问题来学习?

  • 为何编码?
  • 何为编码?

1.1 为何编码?

从存储角度和网络传输以及通用性 3个角度,压缩已经成了不可或缺的动作.压缩编码最基本的指标,就是压缩比. 压缩比通常都是小于1(如果等于或者大于1,是不是就失去了编码的意义了.编码的目的就是为了压缩数据体量).

1.2 何为编码?

编码就是按照一定的格式记录采样和量化后的数据.

1.2.1编码中软编码和硬编码的区别?

  • 硬编码: 使用非CPU进行编码,例如使用GPU芯片处理
  • 软编码: 使用CPU来进行编码计算.

1.2.2 软编码与硬编码的区分?

  • 软编码: 实现直接、简单,参数调整方便,升级易,但CPU负载重,性能较硬编码低,低码率下质量通常比硬编码要好一点。
  • 硬编码:性能高,低码率下通常质量低于硬编码器,但部分产品在GPU硬件平台移植了优秀的软编码算法(如X264)的,质量基本等同于软编码。

读者理解:
硬编码,就是使用GPU计算,获取数据结果,优点速度快,效率高.
软编码,就是通过CPU来计算,获取数据结果.

1.2.3 压缩算法

压缩算法分为2种,有损压缩与无损压缩.

  • 无损压缩:解压后的数据可以完全复原,在常用的压缩格式中,无损压缩使用频次较低
  • 有损压缩:解压后数据不能完全复原,会丢失一部分信息.压缩比越小,丢失的信息就会越多.信号还原的失真就会越大.

需要根据不同的场景(考虑因素包括存储设备,传输网络环境,播放设备等)选用不同的压缩编码算法.

二. 直播APP需求剖析

2.1 直播项目流程

在直播项目中,一般常见有8个步骤.

  • 音视频采集
  • 视频滤镜
  • 音视频编码
  • 推流
  • 流媒体服务器处理
  • 拉流
  • 音视频解码
  • 音视频播放

这个在开发者面试一些有意向或者目前业务中包含直播需求的公司,最为常见的面试题.不管在我们过往的工作经验是否有直播或音视频相关经验.这个一块都是你必须能了解.希望大家可以简单的了解.

2.2 相关框架的学习与使用场景

Snip20180723_97.png
  • 采集视频,音频
    • 使用iOS原生框架 AVFoundation.framework
  • 视频滤镜处理
    • 使用iOS原生框架 CoreImage.framework
    • 使用第三方框架 GPUImage.framework
  • 视频\音频编码压缩

    • 硬编码
      • 视频: VideoToolBox框架
      • 音频: AudioToolBox 框架
    • 软编码
      • 视频: 使用FFmpeg,X264算法把视频原数据YUV/RGB编码成H264
      • 音频: 使用fdk_aac 将音频数据PCM转换成AAC
  • 推流

    • 推流: 将采集的音频.视频数据通过流媒体协议发送到流媒体服务器
    • 推流技术
      • 流媒体协议: RTMP\RTSP\HLS\FLV
      • 视频封装格式: TS\FLV
      • 音频封装格式: Mp3\AAC
  • 流媒体服务器

    • 数据分发
    • 截屏
    • 实时转码
    • 内容检测
  • 拉流

    • 拉流: 从流媒体服务器中获取音频\视频数据
    • 流媒体协议: RTMP\RTSP\HLS\FLV
  • 音视频解码

    • 硬解码
      • 视频: VideoToolBox框架
      • 音频: AudioToolBox 框架
    • 软解码
      • 视频: 使用FFmpeg,X264算法解码
      • 音频: 使用fdk_aac 解码
  • 播放

    • ijkplayer 播放框架
    • kxmovie 播放框架

    ijkplayer,kxmovie 都是基于FFmpeg框架封装的

显示全文