Depth.Love Blog

GitHub:https://github.com/depthlove

0%

英语原文:AI and Machine Learning Push Video Quality to New Heights

人工智能和机器学习将视频质量推向新的高度
人工智能和机器学习以及深度学习和神经网络正在解决编码质量到隐藏字幕的 OTT(Over To Top)挑战。
作者:Ankur Patel
发布时间:2018-02-15

[对人工智能和机器学习如何彻底改变视频感兴趣?加入我们2月27日在伦敦的流媒体论坛,我们将介绍亚马逊,IBM等专注于人工智能和机器学习的演讲。]

自从1928年第一次播出电视节目以来,视频技术已经从模拟标准清晰度(SD)黑白电视到 OTT 数字高清(HD)流式传输到数百个的连接设备。根据思科最新的可视网络指数,到2021年视频流量将占所有互联网流量的82%,高于2016年的73%。而且,思科首席执行官 Chuck Robbins 预测,到2020年每小时将有100万台设备添加到网络中。 OTT 视频流最大的挑战是提供尽可能高的体验质量(QoE)和服务质量(QoS)。

阅读全文 »

今天是2017年12月31日,2017年的最后一天。马上就2018年了,在2017年有什么收获呢。仔细想想,好像没有什么收获,也没有印象最深的事情。

工作中做出的一点成绩就是开发了 iOS 平台的短视频 SDK,服务了一批企业客户。从2017年5月到现在主要就是做短视频 SDK 的事情,为了赶进度,每天都过的很快,没什么感觉。2017年下半年开始带人做一些事情,算是走带团队的路线了,发现在带人上经验上还需要完善,这方面有些小收获。

阅读全文 »

多说评论系统在2017年6月1日关闭服务后,对于自建博客该使用哪款评论系统我犯愁了。我仔细对比了国内的一些评论系统,发现没有一款能比得上多说。虽然我之前的多说评论在导出时发生了数据错乱以至于数据无法导进新的评论系统,但是我从内心底对维护多说服务的技术人员表示认可。在知道多说即将关闭服务之后,我立即就选用了 Disqus。Disqus 真的很难用,一是需要翻墙,二是可视化界面做的太糟糕。不想在评论系统上大费周折,就将就用到了现在。终于忍无可忍,搜索了些资料发现了基于 GitHub issue 的 gitmentgitalk 两款评论插件。经过比较我选用了 gitment

阅读全文 »

和子由渑池怀旧 苏轼 人生到处知何似,应似飞鸿踏雪泥。 泥上偶然留指爪,鸿飞那复计东西。 老僧已死成新塔,坏壁无由见旧题。 往日崎岖还记否,路上人困蹇驴嘶。

每一场剧的谢幕,都将会有一场新剧情演绎。体会这过程,人生阶段的爱恨交加才能不偏不倚,急于实现内心的渴求,往往在达到目标之后深深地感悟到人生的那些阶段本不该如此,人生的每个阶段应该是快乐的、幸福的,简单的。虽有现实的,人性的因素,让内心波浪起伏,只能说经历太少,对人生和生活理解的并不透彻。人生历程的持续,人生观、世界观、价值观都在向前演绎,是变好了,还是变坏了,取决于生活的态度。社会的浮躁,人心的攀比,在这人与社会演进的长河中,是走在岸边看风景,还是被吸进河中陷于疲惫挣扎。人需要有欲望,需要尝试,才能感悟。千人千种经历千种感悟,不变的是最终都会回归到来到出生时最简单的世界。人生每十年是一个阶段,十岁前的自己,二十岁前的自己,三十岁前的自己,四十岁前的自己……想一想,社会教会了人识别复杂的事物,人也从复杂中的事物中明白了最简单的道理。人生不过百余年,有所得,有所失,患得患失才是罪过。往前一步,可以向后看,不能后悔但需反思。读懂内心,何处不是“面朝大海,春暖花开。”

阅读全文 »

常见的 FLV 文件里封装的是 H.264 和 AAC 数据。对于 H.265(HEVC),FLV 支不支持呢,答案是官方版本不支持。想用 FLV 封装 H.265 数据,那该怎么搞?首先,需要一套 H.265 的编解码器,其次,就是扩展 FLV 的头 header,其实是增加对 H.265 CodecID 的支持。

今年6月6日苹果开发者大会开放了 iOS 平台的 HEVC API,也就是开发者可以调用 iOS 系统的 API 进行 H.265 硬编码了,但是只能在 iOS 11.0 及以上版本使用。目前,iOS 11.0 正式版还未正式发布,需要等到今年的9月份。不建议开发者将自己的 iOS 设备刷到 iOS 11.0 beta 版,因为升级 beta 版后非常卡。经测试,苹果的 H.265 编码出来的图像质量还是可以的,但是消耗码率较高。

苹果开放 H.265 编解码 API 势必会影响到整个 H.265 行业的发展,但 H.265 离真正落地和普及还需要时间。明年(2018年)再看 H.265 对整个音视频行业的影响。

阅读全文 »

去年(2016年)做深度学习项目的移动端移植用到了 cmake,现在把当时写的一篇使用流程贴出来,主要目的是备忘。废话不多说,直接进入正题。

1. 下载 X11 并安装

关于 Mac 版 X11,Mac 不再随附 X11,但 XQuartz 项目会提供 X11 服务器和客户端库。XQuartz 项目提供适用于 MacOS 的 X11 服务器和客户端库,网址是 https://www.xquartz.org。下载可用的最新版本并安装。具体说明见:关于 Mac 版 X11

2. 下载 cmake 的 dmg 格式并安装

下载地址: https://cmake.org/download/,本文使用的是 Mac OSX 10.6 or later,cmake-3.7.1-Darwin-x86_64.dmg 版本。

3. 终端安装 cmake

在终端执行命令:

sudo "/Applications/CMake.app/Contents/bin/cmake-gui" --install
阅读全文 »

今天是5月20号,微信里各种撒狗粮、秀恩爱。这一切,都跟我没什么关系,该看资料看资料,该写代码写代码,该睡就睡。日子就是这么单调、有规律。

翻了翻博客里以前的文章,最近一年没怎么写技术性文章,写的都是些心情、感悟。工作忙是一个原因,生活中对未来的规划的不确定性也是一个导致自己静不下心来写技术性文章的原因。以前,还会看看文学方面的书,放松下。现在,书看的少了,写起东西来词穷,流水账的陈述,自己都看不顺眼了。文字这东西很奇妙,把内心的心情通过文字表述出来,能释放压力,缓解精神上的负担。当寂寞空虚冷的时候,就真正明白书和文字才是疗伤的良药。

写到这里,想起一句话,原文不记得了,意思大概是“当你没能力时,遇到想要呵护的人是那么地难,当你有能力时,那个对的人已经离你而去”。生活就是这样,得向前看,你只要往回看,伤心是难免的。

阅读全文 »

定风波/定风波·三月七日 【作者】苏轼 【朝代】宋 三月七日, 沙湖道中遇雨。 雨具先去, 同行皆狼狈, 余独不觉。 已而遂晴, 故作此。 莫听穿林打叶声, 何妨吟啸且徐行。 竹杖芒鞋轻胜马, 谁怕? 一蓑烟雨任平生。 料峭春风吹酒醒, 微冷, 山头斜照却相迎。 回首向来潇瑟处, 归去, 也无风雨也无晴。
阅读全文 »

配一台个人使用的深度学习机器大概会花费2万人民币,比如其中的核心部件英伟达 Titan X GPU 售价大概9000人民币左右,这个价格对于一般人还是略贵的。想深层次进入深度学习应用领域,花点钱是必须的。正所谓有投入才有产出。本人现在还没有入手深度学习机器的预算,所以使用 Mac Pro 利用 CPU 计算来玩玩简单点的深度学习项目。

我的 Mac Pro 配置为:

1
2
3
4
5
6
7
OS X EI Capitan
版本 10.11.6 (15G1212)
MacBook Pro(13 英寸,2015 年初期)
处理器 2.7 GHz Intel Core i5
内存 8 GB 1867 MHz DDR3
启动磁盘 Macintosh HD
图形卡 Intel Iris Graphics 6100 1536 MB
阅读全文 »

Google 开源的深度学习框架 tensorflow 成为2016年最受欢迎的深度学习框架之一。tensorflow 除了支持 pc 端外,还较好的支持了 android,iOS 移动端平台。移动端作为现在互联网的终端主宰,tensorflow 毫无疑问地会引起移动互联网行业的广泛关注。深度学习在2016年的火爆,以及移动终端的主宰地位,作为程序员的我们,不玩玩 tensorflow 简直就 out 了。

1. fork Github 上的 tensorflow repo

tensorflow 的仓库 repo 位于 Github 上,我们作为开发者要在其基础上做开发,首先就需要 fork 一份 repo 到自己的 Github 账户下。

2. 参考 tensorflow 的官方使用文档编译(使用 tensorflow r1.0 版本)

参考tensorflow 的官方使用文档编译 iOS 平台上的 tensorflow 库。

阅读全文 »