最新新闻:

商汤田丰:未来的视觉城市

时间:2020-08-11 15:49:17来源:经济观察网

在线上生活越来越便捷,各项服务逐步数字化的当下,科技究竟会对我们的生存环境产生怎样的正负面影响?商汤智能产业研究院院长田丰通过《“视觉城市”之路》的主题演讲,讨论了人与人工智能,和我们所在的城市、每天的生活究竟会产生什么样的化学反应。

以下为田丰演讲内容节选:

大家心目中的未来到底是什么样子?我认为,未来城市首先是非常聪明的,远不只是现在所说的基本智慧、智能。比如说主线围绕城市发展稳定性的《西部世界3》里有个超脑来控制整个城市、每个人每天的工作安排,甚至推演未来的发展方向,让每个非常细的分支实现最终目标,保持城市秩序趋于稳定。这和现在说的精细治理蛮像,我国也在提治理现代化,但是究竟能不能达到料事如神,量子超脑控制每个人每天的工作和生活安排,这是一个问号。

第二,在《西部世界3》里未来城市出现了空中出租车和地面的自动驾驶出租车,空中可以节省大量交通时间,避免出现意外。还有大量拥有人类情感的机器人,也向未来提出了不管是人类还是机器人,究竟有没有自主意识的问题。

科幻城市是人类对未来的反思和展望,这些对人工智能和智慧城市的发展有参考意义。因为不管是风险还是机会,都可以在科幻的世界观里得到充分的论证和展现,反向驱动我们去研究AI的伦理,AI的政策,以及AI的产业发展和落地,应该规避哪些事情,在人工智能领域应该提出更多富有温度,富有价值观,富有善恶之分的技术和工具箱。

看完未来再看看现实,在现实中的城市是什么样?

商汤一直在做AR、VR方面的研究,苹果眼镜,谷歌AR眼镜也都在进入量产阶段,不光可以导航,可以看到简单的数字。苹果做了很有突破性的事情,把原来的APP Store直接映射到眼镜上,或者是透过眼镜看到皮肤上,可以在手掌等一小块平面投射屏幕,接入原来所有的2D应用。应用在升维,到一定程度,可以在眼睛里完全替代现有环境,不只是叠加,可能就更像是《头号玩家》了。

51VR这家公司把城市通过3D建模,变成数字孪生城市,在这里可以看到所有数字化的环境,背后会带来生活中的数据,而这些精细粒度的数据对于城市治理、交通管理、日常生活,有很大价值。

现在爸爸妈妈上班非常忙,家里的小朋友在家,看书时需不需要有个机器人陪伴他,这个机器人特别会讲笑话,跟小朋友之间用儿童语言在交流。商汤战略合作伙伴物灵科技的儿童陪伴机器人是猫头鹰形状,两个大眼睛就是显示器,眼睛上面有摄像头,可以看到你正在看什么书,甚至你写出的中英文,可以给你解释,比如写“掩耳盗铃”的成语,它给你讲一段故事。这样的机器人会成为家庭里的一员,而不仅仅是一个工具。未来的我们身边不管是大人小孩老人,都会有相应的陪伴机器人。

现在最火的地摊经济,烘烘机器人这家公司有一个开云汽车平台在做地摊车。这个地摊车平常可以运货,晚间可以出来摆夜市,早晨可以摆早摊点。车箱结构化,有保温的仓储小空间一个个隔开。不管卖水果生鲜,还是手工艺品,都会有特别好的展现。科技在引领人类的进步。

日常看到大量的电视剧、网综节目,视频背后有大量的广告商赞助的。一家银火科技公司,正在用人工智能的技术识别视频里面的大量广告位,用技术去插入最适合这个场景的广告。

我们看到,未来很多的创新都是依赖于视觉的,因为人类输入的85%的数据都是依靠眼睛看到的。当城市每一个角落,每一个设备都拥有了视觉感知能力,它的认知会极大增强。

视觉的发展离不开媒介的变革,不管是早期的书报,后面通过语音的电话电报,延伸到电影广播到电视,延伸到PC,手机,到现在万物皆屏的时代,还有未来的AR增强现实、XR扩展现实时代,现在是视觉物联网的大变革。每次的媒介变革都会产生一个巨大的商业模式和行业,BAT是在PC互联网时代诞生的,现在的抖音快手是在移动互联网时代诞生的,下一代如果AR和带屏IoT的大面积普及会不会产生新一代的互联网模式,甚至是实体产业的大变迁?

媒介不可能单独存在,一定是网络形式,网络的变革会带来大量机会。5G时代,人工智能和AR、VR的物联网设备把每个点的能力提升,串起背后的网络后,形成巨大的网络效应。而在网络的底层,支撑5G通信效率的实际是计算的革命。

从媒介变革说到网络变革,以前的网络是大量的传感器,我们正处于无处不感知,无处无传感的时代,游戏机上有体感感知器;联网的无人机上有视觉感知;自动驾驶和辅助驾驶的汽车,像特斯拉有十几个传感器远程控制;生产线的机器手上也逐渐加上了视觉控制;视频分析平台上大量针对实时视频流的感知审计;还有5G专网,5G由铁塔承办,每个铁塔上都有视觉感知设备,不仅能够监控铁塔自身安全,同时能够监控周边的森林火灾,地质灾害。

这样强大的感知网络可以进入所有的行业,不管是广电媒体还是能源行业,新能源新交通,智能制造行业,包括旅游、医疗等领域。

产生了新的广告和媒介形式后,也会产生商业的新物种。比如说B站在启动4K的UP主的支持,以后所有视频都可以变成4K。有的人说我的设备没有那么好,没关系,商汤有算法可以帮你把1080P变成高清的4K或者8K的视频题材。包括现在有了5G,可以在云端计算游戏的各种任务和操作,无延迟地传递到任何一个有屏的设备上,未来终端会越来越轻量化,是云游戏时代,哪怕家里空调的触摸屏都可以玩游戏。

未来将会有更泛滥的5G的视觉和商业新物种的爆发,一个城市里究竟有哪些终端能够产生视频,手机,IT摄像头,智能汽车,智能家电,无人机,运动相机,专业影视摄像机,机器人,还包括身边的智能路灯,这是视觉的生产端。

未来只要带屏的都是消费侧,不管是个人的手机、平板、AR眼镜、电视屏,还是政府侧的指挥监控大屏,车载屏,包括电影院里的院线大屏,广告屏都是我们内容的消费端。

但是有一个区别,上一代智慧城市只知道执行,无法做自我学习,而未来的智慧城市,所有终端都懂得自己学习和进化,不管是云端、边缘侧还是终端都有自学能力,如果授权可以进行自我决策。

上一代城市治理是看大量数据,让人去看城市中海量增长的数据是不人性的,也没有人能够看完,更无法保证实施性。我们正在进入新时代,如果城市全是动态可数字化的数字孪生,比如有人乱丢垃圾,马上可以在数字孪生城市线上报警,追踪到是谁。或者商业街上某个门店排队特别长,是否可以建议开更多门店,选址也会有上下游更好的配合,这些都靠我们对未来城市治理做数字孪生巨大的前期投入。

未来城市的每个角落都会布满相应的传感器,尤其是视觉的传感器。路灯、充电桩,换电站都会有视觉的交互能力,自动送货的物流机器人也有大量摄像头,包括自动驾驶汽车。对无人机来说,亚马逊也推出了母舰,飞艇上带着30架小飞机,在一个区域里快速送货,这些都是依靠视觉感知进行的。

未来的中国和社会,是视觉中国、视觉城市的展现,而线上的所有部分都会视频化,8.5亿的中国视频用户成为最主要的视频载体,B站、抖音都会出现视觉新物种,所有产业都是通过视觉物联网产生的,71亿的中国物联网的连接,绝大多数都有视觉的赋能,不管是摄像头,自动驾驶汽车,扫地机器人还是手机,都会有视觉的感知和认知,包括决策能力,视觉的基建接下来是以商汤AI的超算为代表的产业。一切基建AI化(例如智能路网等),一切AI基建化(例如商汤SenseParrots智能视觉平台、SenseFoundry智慧城市平台),简单地说新基础设施一定要有AI嵌入在里面,所有的人工智能都应该平台化,来制成更多应用创新。

声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。

图文推荐

热点排行

精彩文章

热门推荐