想要用手机查看汽车模型?有什么好的软件推荐吗?,

AI走向终端,掌上“万能助手”离我们还遥远吗?

在无数科幻游戏、科幻电影以及小说中,当科技爆发到了一定阶段,总少不了AI的身影。它们不吃不喝,却又无所不知,扮演着人类身边“完美搭档”的角色。


微软游戏《光环》中角色——科塔娜(图源网络)

正如一切幻想都需要建立在认知之上,人们对于AI的终极思考和幻想,无论如何也是绕不开现实世界的。

实际上,尽管人工智能代表了最前沿科学技术,但它距离我们并不遥远,对大部分人来说,日常用到AI的次数,其实远比大家想象中多得多。

AI,随处可见

眼下谈及AI,大家会想到以ChatGPT代表的众多生成式AI应用。它们可以自动生成文本、摘要、翻译、对话,也可以用于生成逼真的图像、视频和动画,甚至协助用户创作音乐,帮助开发者撰写代码等等。

AI能做的事情远不止这些,只不过ChatGPT的到来,让人们对于AI能做什么有了切实体验。

手机人脸识别

其实在日常生活中,AI应用随处可见,比如在AI视觉方面,小区的门禁系统,手机的人脸解锁,超市的人脸支付等等都用到了AI人脸识别技术。

还有每个人都离不开的智能手机,同样应用了大量的AI技术。最典型的就是影像场景,手机以远不及相机的光学素质却能拍出媲美专业设备的夜景照片和视频,AI在其中起到了决定性的作用。

以最新的骁龙8Gen2第二代骁龙8旗舰手机为例,高通给第二代骁龙8移动平台注入了强悍的AI“灵魂”,使得智能手机的拍照体验得到了进一步的提升。高通在骁龙平台打造了业内首个“认知ISP”,由此还实现了一种叫“实时语义分割”的技术,该技术有点类似PS中的图像分层,可针对图像中的不同区域进行独立优化,大到背景,小到面部细节,都能进行独立优化。

具体来说,大家平时拍照时用到的背景虚化,或者更换风格化背景图案,以及针对人像用到的一些美颜、美肤处理等等,借助实时语义分割实现起来将变得更加轻松。

这是AI在移动影像中的简单用例,但透过这个例子,不难发现今天的智能手机早已和AI深深绑定。事实上,除了OCR扫描、智能语音助手、图库分类、屏幕识别、面部识别这类比较常见的手机AI应用外,AI还在网络连接、音频、游戏、续航方方方面发挥着重要作用,比如上网时,合理分配网络,让蜂窝信号、Wi-Fi更稳定;玩游戏时,智能调用系统资源,让画面更流畅等等。

终端侧算力大涨,AI大模型下沉

和智能手机一样,AI在汽车、XRP、PC、物联网领域同样有着广泛的应用,也正是基于这种“AI+”的形式,从而涌现出了更多创新的应用场景,进一步丰富用户体验。

无论是手机还是汽车,作为独立的终端产品,与AI相结合确实有那么点天作之合的意思。但必须承认,尽管此前业界讨论AI的声量很大,但距离大模型AI真正落地终端侧,还是有一段距离的。

不同于云端AI,在终端侧部署AI不是说想做就能轻易实现的,比如算力问题。和云端可以提供的算力相比,终端侧所能提供的算力就很有限了,像目前比较火的一些大模型,过去就很难在智能手机这样的终端产品上运行。这就意味着,想要AIGC应用在智能手机上有个很好的体验,其实很不容易,正如在云端生成一张AI图片可能只需要十几秒,但在手机上可能就要几分钟甚至更久,体验可以说是大打折扣。

不过“有难度”并不代表“没可能”。其实早在今年2月份,高通就已经发布了全球首个运行在Android手机上的Stable Diffusion终端侧演示,Stable Diffusion本身就是一个基于输入的文本生成图片的AI模型,它的参数超过10亿,这样的参数规模过去只能在云端计算集群内运行,现如今也终于可以在终端侧运行了。

很显然,没有强力的算力作为支撑,实现这样的“壮举”几乎是不可能的。而高通之所以可以首个实现,这里不得不说到骁龙移动平台。

以最新的第二代骁龙8移动平台为例,这款芯片的AI计算能力已经是天花板级别的了。

根据全球知名的AI基准测试网站AI-Benchmark排名统计,我们发现在前十位的智能手机中,搭载第二代骁龙8移动平台的机型就占据了八席,其中就包括第一到第七名。

事实上,第二代骁龙8移动平台能够在AI计算方面大杀四方并不令人感到意外,它搭载最新的高通AI引擎,全新升级了Hexagon处理器,支持更高规格的张量加速器,并且增加硬件加速,从而可以快速高效地运行Transformer网络,这也使得第二代骁龙8在自然语言处理应用上有着更突出的优势。

除此之外,骁龙移动平台一向具备出色的可拓展性,大部分骁龙移动平台通常都有一个Hexagon处理器,但如果面向的对象对AI计算量需求更高,比如汽车,则会使用两个甚至多个Hexagon处理器来提高算力,这无疑为在更多元的终端设备上部署AI提供了强大的算力支持。

高通AI软件栈,跨终端部署利器

借助第二代骁龙8移动平台,让我们看到了高通在硬件方面的一些优势,其实在推动终端侧AI部署过程中,高通在软件方面所提供的技术,同样起到至关重要的作用。

此前高通发布了可使AI由单一终端较容易地扩展到其他各种终端的高通AI软件栈(Qualcomm AI Stack),它为OEM厂商和开发者提供一套完整的AI解决方案,这套方案是集成所有AI框架、开发者库、操作系统的整合平台,也同时具备了“一次开发,多终端使用”的特点,简单来说,用户只需要开发一次模型,就能在不同的高通产品创建、优化和部署其AI应用,充分利用高通AI引擎的性能。

前面我们提到了高通AI Research利用高通AI软件栈执行全栈AI优化,这一全栈优化最终让Stable Diffusion能够在智能手机上运行,在15秒内执行20步推理,生成一张512x512像素的图像。

而在智能手机上运行Stable Diffusion只是开始。目前,高通已经能够实现在搭载骁龙计算平台的笔记本电脑上运行Stable Diffusion,凭借行业领先的高通AI引擎,基于骁龙计算平台的笔记本电脑在MLCommons V3.0上率先实现了出色的MLPerf基准测试结果。在终端侧运行如此大规模AI用例,高通再一次走在了行业前面。

最后:

作为终端侧AI的重要推动者,高通已经成为推动终端侧AI规模化发展的关键力量,相关技术正在赋能数十亿的终端产品。如今看来,无论是单一产品优秀的性能功耗表现,还是规模化成果,以及跨AI应用、模型、硬件与软件的全栈终端侧AI优化,高通都存在着显著优势。

很显然,在AI即将迎来“质变”的关键时刻,高通正扮演着愈发关键的角色。甚至就在不久前,高通正式发布《混合AI是AI的未来》白皮书,明确提出了云边一体混合AI发展路径。从架构设计来看,混合AI适用于几乎所有生成式AI应用和终端领域,而且具备低成本、高效率、低能耗、运行稳定、隐私性强等优势,对开发者,对用户,都可以说是非常值得期待的。

无论如何,AI发展的终极目标还是更好服务于人,这个过程肯定艰难的,不过也正因为有了更多人的努力,才让目标离我们越来越近,直至触手可及。

2024-01-11

2024-01-11