AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

从2023年下半年开始,AI成为了消费电子行业的重要议题,各种产品如AI PC、AI手机、AI扫地机器人等纷纷涌现,似乎万物都在向AI化迈进。

作为行业领导者,苹果在这一年中展现出了相对低调和谨慎的态度。除了在最新的iOS系统中展示了一些「机器学习」的功能之外,苹果并没有过多地公开其在AI领域的进展。

然而,根据彭博社记者马克·古尔曼(Mark Gurman)的最新报道,苹果正在秘密研发AI眼镜和带有摄像头的AirPods。

AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

图片来源:AI生成

事实上,自2024年起,越来越多的可穿戴智能设备开始进入人们的视线。例如,三星的Galaxy ring和AI Pin,尽管还未正式上市,但已经吸引了全球的关注。在CES上备受瞩目的Rabbit R1,其创始人吕骋也预测,未来的产品形态可能会是一个基于TWS形态的可穿戴智能设备。

所以,消费电子行业的下一个热点会是可穿戴智能设备吗?

下一代终端设备,黎明不远?

据彭博社马克·古尔曼爆料,苹果全新的智能眼镜将会比Apple Vision Pro更加便宜,产品形态类似Meta Ray-Bans智能眼镜,配有内置扬声器、摄像头、健康传感器和人工智能功能,用户可以在没有显示屏的情况下与之对话。

至于带有摄像头的AirPods,其在Apple的内部代号为B798。大小和现有AirPods几乎相同,加入了低功耗摄像头,可调用AI功能对用户的日常使用提供帮助。

身在XR行业的刘平告诉钛媒体App,如果苹果愿意,在现有Apple Vision Pro的基础上,砍掉对外显示眼部状态的显示屏就可以获得一个重量更轻、佩戴舒适度更好、价格也更便宜的眼镜产品。目前行业的相关供应链已经很是成熟,对于苹果这样的公司来说,做一个眼镜产品不是难事。

苹果的两款新品,一同指向了用于长时间佩戴、可以时刻保持在线的可穿戴智能设备,这种似乎并不新鲜,但也从未大红大紫的产品。

早在2012 年 ,Google I/O 大会上,Google Glass横空出世,被认为将会是定义未来十年科技走向的产品。

Google Glass可以显示天气、消息、电话等信息,也可以用来拍照、录视频、导航,或者唤起Google Assistant帮助你搜索内容。即便是在十年之后,这也不能说是落后的概念。

尽管Google Glass在技术上表现出其“先锋”的特点,但从实际应用中来看,它仍然存在一些显著的缺点:首先,尽管官方宣称其标准续航时间为6小时,但在实际使用中,特别是在频繁拍照和录像的情况下,其续航时间可能仅为2小时,而这正是Google为这款产品所强调的主要功能之一;其次,由于Google Glass配备了摄像头和麦克风,引发了隐私和社交隔阂问题,使得佩戴者周围的人可能会担心自己被未经许可地拍摄或录音,从而产生了警惕和不安的情绪。

受限于彼时的硬件算力、制程工艺、网络基础设施、社会接受程度,无论是Google Glass还是随后国内跟上的百度Eye,都没有取得成功。但时至今日,仍然有不少人记得这款产品,也算是帮助后来的一系列可穿戴智能设备在社会中建立了认知。

进入2024年,新形式的可穿戴智能设备在AI和算力的同步加持下,似乎开始了又一次的「攻势」。

AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

图片来源:AI生成

在最近结束的MWC展会上,三星智能戒指Galaxy Ring首次公开展示。这款产品不仅具备健康追踪功能,如心率和睡眠监测,还会根据用户的身体状态给出评分。此外,Galaxy Ring还拥有与智能手机相似的非接触式支付功能。

三星方面透露,未来将通过其可穿戴设备,进行无创血糖监测和血压传感,而这将是一个巨大的进步。除了传感器需要突破外,三星方面也指出,可穿戴智能设备可以提供更深入的健康理解。

三星电子数字健康团队负责人Hon Pak表示,“想象一下,这个大型语言模型充当我的数字助理,同时查看我的医疗记录、生理数据、我与移动设备的互动情况。这将带来更多的洞察力和个性化的机会,人工智能助手可以在此期间提供帮助。”

除了苹果、三星这样的消费电子超级巨头外,很多厂商也嗅到了可穿戴智能设备的新机遇。

2023年11月,美国科技公司Humane发布了可穿戴智能设备——Ai Pin,以全新的人机交互理念和搭载GPT大模型等特点,快速在国外网络上获得广泛关注。

Ai Pin是一款无屏幕智能设备,完全依靠语音和手势来完成交互,以磁吸的形式佩戴在用户的衣服上,支持常规手机上的通话、音乐播放、拍照录像等功能。Ai Pin本体重量约34克,磁吸电池重量为20克,售价699美元,订阅费每月24美元,预计于2024年3月发货。

AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

图片来源:Rabbit官方视频

2024年1月10日,前渡鸦科技创始人吕骋发布了Rabbit R1。这款产品具备交互式问答功能,在绑定Uber、Spotify等账号后,用户可以通过语音操作播放音乐、打车、订餐、规划旅行等。

Rabbit R1具备视觉识别功能,可以识别冰箱里的食物并为用户规划低热量晚餐。该产品利用自家的大型动作模型(LAM)学习并重复用户在PC端的操作。用户只需发出语音指令,Rabbit R1就能重复此前在PC端的功能。

虽然Rabbit R1并不是一款「可穿戴」设备,但从其设计理念上,一款「可移动」智能设备,也许就是可穿戴智能设备的试制品。吕骋在视频对话中曾表示,Rabbit R1是一款从软件角度出发而非硬件的产品。由于当前芯片和主板技术的限制,Rabbit R1的大小只能达到「半个iPhone Pro Max」的程度。

不过未来的Rabbit产品形态可能会更加小巧,可以集成在TWS耳机上,或者以智能手表的形式出现。「如果是一个像Airpods Max一样大的产品,我们早就能够做出来了」吕骋补充道。

钛媒体App根据Canalys此前公布的数据测算,全球智能可穿戴腕上设备总出货量达到了1.845亿台,相比2022年的1.828亿台,仍保持了增长态势。在全球消费电子普遍疲软的时间点上,可穿戴智能设备体现出足够的韧性。

算力与AI,产品背后的源动力

AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

图片来源:AI生成

在越来越多在前台展示给公众的产品之外,可穿戴设备的迅速升温,离不开背后算力、人工智能和厂商用户学习能力的逐年提高。

目前,高通最新的可穿戴设备芯片是2022年发布的骁龙W5+,为可穿戴平台打造,采用4nm工艺,支持低功耗状态功能,即引入了深度睡眠和休眠这两个工作机制,让同样是300mAh电池的手表,在换装W5+后可以多使用15小时。钛媒体App从可穿戴智能设备厂商方面获悉,W5+的表现并不能让人满意。

曾在国内某大厂负责智能手表研发的李天告诉钛媒体App,在智能穿戴设备方面国内厂商其实不缺想法和方案,但往往会在芯片层面遇到天花板。

“国内厂商的高端智能产品用的基本都是高通的方案,虽然比不上苹果的芯片,但也是能买到的最好的选择。往往我们想做一个24小时standby的功能,最后到了产品层面,要不就是算力达不到要求,要不就是功耗过高影响续航,就只能放弃掉。考虑到无论是智能手表、智能手环、眼镜,都只有很小的空间容纳电池,因此导致产品的智能化水平一直维持在一个较低的水平。”

正因高通芯片的性能不佳,苹果和三星得以凭借在芯片领域长期积累的优势,在这场可穿戴智能设备的竞争中抢占先机。

据《电子时报》报道,三星正在测试在SF3 节点上制造的芯片的性能和可靠性。这是三星使用3nm工艺的首款芯片,预计将设计用于可穿戴设备。公司很可能会在三星 Galaxy Watch 7和其他设备发布之际,正式推出这款芯片。

在苹果这边, 最新款Apple Watch Ultra 2 所搭载的全新 S9 SiP 芯片所采用的双核中央处理器,具有56亿个晶体管,相比上一代增加了60%之多。而新的四核神经网络引擎,处理机器学习任务的速度最快达两倍。得益于领先的算力, Apple Watch Ultra 2支持了全天候的double-tap手势,当用户不方便使用手指触控屏幕进时,只要将食指和大拇指捏合在一起,就可以触发接听电话等操作。

虽然,目前Apple Watch Ultra 2所采用的芯片仍为5nm工艺。但是,有消息称苹果下一代可穿戴智能设备将会采用和iPhone 15 Pro相同的3nm工艺,其性能与功耗也要好于现有的产品。

AI新机遇,苹果、三星再战可穿戴智能设备,能否实现当年Google Glass的梦想?

图片来源:AI生成

除了核心芯片之外,具有边缘智能能力的MEMS芯片也正在为可穿戴智能设备的续航表现提供助力。像是生活中常见的智能手表,之所以能够每天监测自己是否完成了锻炼目标,就是依靠MEMS实时监测加速度的变化,从而获知佩戴者运动的状态。运动时加速度计MEMS检测到一个周期性的正弦波,通过计算波峰、波谷的数量,就知道佩戴者每天运动的步数是否达标。

像智能手表、TWS耳机,只需要为加速度计MEMS保留一个很小的供电,就可以让大部分系统保持待机状态,无需调用核心芯片,从而最大程度上实现节能的效果。以ADI的ADXL367 MEMS芯片为例,针对于TWS真无线的耳机,ADXL367已经集成了单击、双击的监测算法,因此不需要TWS厂商去做算法分析,MEMS可以通过判断输出波形来确定用户是不是在做一个或者双击的动作,从而解放中央处理器的计算压力。

除芯片外,如今的人工智能也在一日千里的发展。

以GPT3.5和GPT4为例,早先版本的GPT3.5的参数规模是1750亿,最新款的GPT4的参数规模已经达到了1万亿。而更大的参数规模,就意味着模型的表达能力和记忆能力越强,可以处理更复杂的任务和问题,

吕骋在与This Week in Startups的对话中,曾表示如今大模型的普及,对于人与设备的语音交互有着重要的意义。吕骋透露,上一次创业时推出的渡鸦智能音箱产品,受制于人工智能的水平,其语音识别正确率只有73%-74%,不能让人满意。而在2024年的大语言模型帮助下,如今Rabbit R1可以以70种方式去理解同一句话,语音识别正确率大幅提高。

在大模型应用方面,相关厂商也已经开始了布局,像是华米就在MWC 2024展会期间发布了由AI大模型语言驱动的Zepp Flow。不同于以往的产品,Zepp Flow允许用户自由表达,无需特定的命令短语,且能做到高效识别和精确理解。

而在此前,vivo已经在vivo Watch 3上发布了蓝河操作系统,内置了蓝心大模型。虽然暂时只能能够提供AI创作智能表盘等功能,但也算是迈出了重要的一步。

在2024年这个时间节点上,有智能手机和PC的映衬,可穿戴智能设备的新一轮集中爆发似乎有些姗姗来迟。但正所谓「好饭不怕晚」,在芯片技术的加持之下,乘着大模型发展的东风,在一个接受程度更高、科技气氛更加活跃的社会环境中,也许就能够实现当年Google Glass改变世界的梦想。(本文首发钛媒体App 作者/吴泓磊 编辑/钟毅,文中刘平、李天为化名)

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:Metatrend元潮

Like (1)
Previous 2024-03-15 19:12
Next 2024-03-15

相关推荐

  • 印度即将测试央行数字货币“电子卢布”

    Decrypt 10 月 10 日报道,根据印度央行近日发布的一份文件,印度储备银行已提议分阶段试点其中央银行数字货币(CBDC)。 该文件指出,印度储备银行计划在有限的试点中推出电子卢布,旨在将其作为与纸币一起发行的另一种货币形式;电子卢布也将作为加密货币的替代品。 印度央行认为,不受限制地使用加密货币对印度的金融和宏观经济稳定构成风险,这削弱了政府确定和监管货币政策的能力,进一步增加了对 CBDC 的需求。 据了解,印度央行正在考虑发布两种版本的 CBDC:一种用于公众零售支付,另一种用于银行之间转账结算和批发交易。 印度政府于 2 月首次宣布启动 CBDC 计划,称该技术将大大推动印度的经济发展。 印度储备银行引用了中国和其他 16 个目前正在试行自己 CBDC 的国家作为现在推进电子卢布的理由。分析称,印度可能感受到了中国稳步推进  CBDC 的压力。 除了中国央行数字货币,6 月,美联储主席鲍威尔表示,国会最终将获得美国中央银行关于发行 CBDC 的指导。据了解,美联储早在 2017 年开始就一直在研究数字美元的前景。​​​​

    2022-10-10
    4.1K
  • 定义旗舰新基准,雅迪冠能打造中国品牌「新牌面」

    商业成功的本质是相通的,即便是不同的产业,背后也都有着相似的逻辑。 特斯拉的成功,很大程度上来源于其将原本应用在航天领域的技术和工艺转移到汽车制造业。这种跨产业的技术转移让特斯拉持续领先的同时,也推动着整个汽车产业的革新。在电动两轮车行业,相似的故事也正在上演。 在新出行理念下,电动两轮车逐渐成为城市中短途出行新风尚,产业规模加速扩大。中国自行车协会也指出,截至2022年底,我国电动两轮车社会保有量约3.5亿辆,远超汽车总体保有量,成为日常出行不可或缺的重要组成部分。 着眼于出行领域,不仅需要满足需求,还需要充分考虑体验。在雅迪看来,不论是刚需用户,还是个性化玩家,都对产品的品质有了更高的要求,这也是对企业生产制造能力的综合考验。卓越的技术是打造优质产品的基础,往往细节更能体现功力。 作为连续6年全球销量第一的品牌,雅迪正在将汽车级的技术、工艺以及设计应用到电动两轮车产品中,刷新行业的标准。2月28日,雅迪冠能再升级,以汽车级工艺实现产品品牌的全面跃迁,三款全新车型雅迪冠能6代 Q50、雅迪冠能6代 T60、雅迪冠能6代 M85正式发布,依托雅迪TTFAR 6.0长续航系统、雅迪方舟智能安控系统以及雅迪智行系统,定义旗舰新基准。 再创先河,“好骑”有了新基准 弗若斯特沙利文数据显示,过去几年,3500元以上的电动两轮车销量增速最高。伴随用户群体的年轻化,对电动两轮车品质的要求也更高。诞生于2020年的雅迪冠能系列,一经推出,便成为行业标杆旗舰,每一代都在划时代,上市第三年便实现了单系列累计销量1500万台的里程碑式突破。 耀眼成绩的背后,是雅迪不断修炼内功的结果。四年时间,冠能系列已成为雅迪的一张名片,每一代都能在旗舰的高标准上不断升级,全面满足用户的多维需求。 需要指出的是,高品质不是简单的硬件堆砌,而是需要能够洞悉到用户内心的真实需求。在冠能系列超千万台销量的背后,雅迪进一步观察到了用户深处的痛点:续航、安全和智能。 2023年,“更高端的长续航电动车”成为雅迪冠能系列的全新定位,推动了行业长续航技术上的升级。沿着这个方向,雅迪科研、市场等相关团队在长期的实地调研发现,用户在这方面的真正痛点不是“无休止加长的续航”,而是“更安心可靠的续航”。 基于用户的需求,依靠雅迪TTFAR 6.0长续航系统,雅迪冠能6代重新定义续航新基准。雅迪常青藤石墨烯铅酸电池实现了容量与寿命的双重突破,新车跑得远、旧车也能跑得远。全新升级雅迪TTFAR全能电机在电动汽车级超薄硅钢片的加持下,实现动力、里程双兼顾,为用户带来超越想象的续航新体验。 续航上带来独树一帜体验的同时,安全则是雅迪认为最大的高端。雅迪冠能6代首发搭载方舟智能安控系统,重新定义安全新基准。凭借全系标配的TCS智能牵引力控制系统,快速识别路面变化,毫秒级监测电机轮转差,在湿滑路面快速响应,打滑/起步时自动抑制空转,雨雪湿滑路面稳步前行。再与雅迪TTFAR高抓地力防滑轮胎、液压减震、高强钢车架等硬件实现软、硬件的高效协同,可轻松保障颠簸路面、湿滑路面、推车倒车、陡坡下行路段、夜间骑车等复杂场景的安全。系统化解决用户的骑行安全问题,重塑人车安全新体验。 在生态互联的今天,为了让“好骑”有更高的标准,雅迪冠能6代还升级了雅迪智行系统,重新定义智能新基准。在蓝牙连接、互联控车等方面带来更为丝滑的表现,让用户的体验感大大提升。 如果说技术上的升级,让雅迪冠能6代开创行业先河,那么在乘坐细节上的突破,更能体现出雅迪的深厚功力。此次发布的雅迪冠能6代三款旗舰新品都有着自己的特色,雅迪冠能6代 Q50在设计上更贴合女生的喜好,好看又好骑;雅迪冠能6代 T60的都市硬派美学和T动力超频模式会更吸引男生,高速状态下更好骑;雅迪冠能6代 M85则更适合全家出行,载人又好骑。从硬件到软体验,让“好骑”有了新基准。 革新的关键,用科技筑起城墙 台上一分钟,台下十年功。前台每一分技术的升级,背后都有着十倍甚至百倍的努力与投入。诚如华为的成功一样,雅迪冠能之所以能够定义旗舰新基准,核心就在于前瞻的战略以及对技术的不断投入,用科技筑起城墙。 前瞻的战略哪里来?答案肯定不是闭门技术自嗨。需要企业有洞察用户需求变化的能力,基于变化去制定战略,而后去打磨。与此同时,“更高端的长续航电动车”的定位,奠定了雅迪冠能研发先行的运营理念。 过去一年,雅迪在研发投入上同比增加31%,专利数量较上年增长19%,通过技术的不断突破为用户提供更好的体验。雅迪冠能系列每一代都在突破行业的上限,科技也已经成为其底色,单单雅迪TTFAR 6.0长续航系统就拥有42项专利技术。 本次升级后的雅迪常青藤石墨烯铅酸电池寿命更长、容量更大、更抗衰减,打破行业天花板,并敢承诺24个月容量衰减超过20%直接换新。这是对用户的负责,也是雅迪对自身技术的自信。 技术上投入的每一毫,都是雅迪推动电动两轮车革新的关键,也是应对未来的底气。 在全球,雅迪还拥有7大生产研发基地,其中雅迪超级智造工厂还拥有众多汽车级的生产制造工艺及设备,推动整个电动两轮车产业的革新,助力中国智造。 中国品牌的“新牌面” 普通企业解决问题,优秀企业“提出”问题,创新与复刻远不在一个等级。在市场竞争加剧和科技快速迭代的背景下,唯有在技术支撑下的高品质,才能走得更长远。 肩负“让亿万人享受美好出行”的使命,雅迪建立了属于自己的护城河,引领全球中短途出行。从登陆央视春晚到进入央视总部,再到如今重新定义电动两轮车新基准,雅迪冠能的标杆之路还将继续,成为中国品牌的新牌面。

    2024-03-15 数字经济
    16.8K
  • “灯带公司”Nothing发新机了,“买手机送大模型”时代来了?

    文 | 雷科技leitech 3月6日,“卖灯带”的Nothing 发布了旗下第三款手机:Nothing Phone (2a),这也是其第一款中端机型。关于这款手机,雷科技MWC报道团前段时间已进行专门的报道和讨论,它的外观设计很多读者应该都知道,确实独特,很“Nothing”。 现在,Nothing Phone (2a)价格定了:英国本土起售价为 319 英镑(约合人民币 2923 元),美国市场(仅 256GB 版本)售价 349 美元(约合人民币 2512),比起英国本土还要便宜不少。 在欧美市场,Nothing 2a(简称,下同)的价格很有竞争力。不过,Nothing 2a这一次的发布最吸引雷科技的在于“买手机送顶级大模型”的全新定价模式。 在 Nothing 发布新机的同时,AI 搜索公司 Perplexity 在 X(原 Twitter)上宣布,限期购买 Nothing 2a 还送长达一年的 Perplexity Pro 订阅,价值 200 美元(约合人民币 1440 元)。 图/ Perplexity 作为当下 AI 搜索引擎的典范,雷科技在多篇报道中都讨论到了 Perplexity,包括在 2023 年度 AI 应用盘点中也进行了重点介绍。而作为一项付费订阅服务,Perplexity Pro 除了支持每天 300 次的 Pro Search,最核心的是可以在底层调用全球最顶级的大模型——GPT-4 Turbo、Claude 3 以及 Mistral Large。 要知道,正常用户想要使用这些大模型通常就要花 20 美元/月,甚至 Mistral Large 还只支持开发者使用,并不面向大众。 如果以美版为例,对于原本就有订阅 Perplexity Pro 的用户来说,价格更是「暴降」至 149 美元(人民币 1000 元出头)。从这个角度,Nothing 2a 感觉更超值。 但随着大模型距离大众越来越近,尤其是顶级大模型的网络效应越来越大,买手机送顶级大模型,这种事情会变成一种未来的常态吗? 在讨论这个问题前,我们还是按照惯例介绍一下这款手机的基本信息——雷科技是专注于AI硬科技的新媒体,我们高度关注AI手机以及AI硬件,但我们认为,AI目前对手机是锦上添花,决定手机整体体验的“传统因素”依然很重要。 Nothing 2a是一款风格独特的中端手机 了解过 Nothing 手机的读者应该都知道,这家由一加联合创始人、前一加全球负责人裴宇创建的消费电子品牌,最为独到的地方就是产品设计。 标志性的透明后盖,Glyph 灯条设计,再加之将简约利落的风格贯彻在直屏、中框以及镜头设计上,都在两代 Nothing 正作上表现得淋漓尽致。而在 Nothing 2a 上,这些特点大体都得到了保留。 Nothing 2a 的后盖同样是透明设计,不过受限于定位采用塑料而非玻璃,Glyph 灯条数量相比旗舰产品有明显削减,只在镜头附近保留了 3 条,功能一样是在接收电话、音乐播放、通知等情况下以灯效的方式提醒用户。 另外在 Nothing 2a 上,无线充电理所当然没了,后置双摄则从「左上角竖排」换成了「居中横排」。从第一眼来看,我个人还是更喜欢原本的竖排设计,不过看多几眼 Nothing 2a 的设计,倒也觉得有些「怪·可爱」。 当然,各花入各眼,如果你觉得丑,那你说得对。 Nothing 在设计上的独特还体现在软件方面,雷科技之前就评测过 Nothing Phone (2),其中谈到了他们在系统(Nothing OS)方面的设计。但总体来说,Nothing OS 还是实打实的类原生系统。 而作为一款中端定位的手机,核心的 SoC 当然也有些不同,Nothing 2a 是采用了联发科天玑 7200 Pro。由于这次 Nothing 2a 是首发天玑 7200 Pro,并没有可供直接对比的机型。不过根据官方公布,天玑 7200 Pro 基于台积电第二代 4nm 工艺,Nothing 2a 的安兔兔跑分则达到 741999,还采用了 3200m㎡ 的均热板。 同时 Nothing 2a 电池内置了一块 5000mAh 电池,支持 45W 快充,放在国内市场或许不够看,但放在欧美市场却是足够领先。 在之前 Nothing Phone (2)评测中,我们就指出了其在拍照方面的「平平无奇」(真的),除了补光没有什么值得说的地方,Nothing 2a 虽然搭载了双 5000 万像素广角主摄和超广角镜头,但更别对它有什么期望。Android Police 的评测就指出,Nothing 2a 不仅差异很大、HDR 效果不好,就连拍照体验也和旗舰机型相去甚远。 在正面,Nothing 2a 搭载了一块 6.7 英寸的 1080P OLED 屏幕,刷新率为 120Hz,峰值亮度为 1300nit。其他部分,Nothing 2a 还支持 IP54 级防水防尘、NFC、WiFi 6 以及双立体声扬声器等。 那么,Nothing 2a 跟价值 200 美元的 Perplexity Pro 年度订阅到底是什么关系? 赠送的Perplexity Pro:200 美元/年的AI新搜索 从 ChatGPT 在 2022 年末刚火的时候,人们就热衷讨论大模型对于「搜索」的颠覆性可能。除了各大搜索公司集体「用脚投票」,更灵活的初创公司也早就盯上了 AI 搜索的赛道。 Perplexity 就是其中最具代表、最被看好的一家。据 WSJ 最新报道,在即将敲定的新一笔融资中,Perplexity 的估值已经从两个月前的 5.2 亿美元跃升到了 10 亿美元,也从侧面印证了 Perplexity 的「含金量」。 而据官方公告,只要在 3 月 5 日至 3 月 19 日期间购买 Nothing 2a,Nothing 会发送 Perplexity Pro 兑换码到邮箱,只要在 4 月 30 日之前到激活就能享受一年的 Perplexity Pro 订阅。 但 Perplexity 的搜索服务到底能带来什么?Perplexity Pro 又有什么区别? 与传统的搜索体验不同,Perplexity 是利用大模型为搜索查询提供直接答案,而非提供经过复杂算法排序后的一堆网页列表,你不需要多次打开链接、浏览、筛选和理解信息。 但也与直接询问 ChatGPT 这类产品不同,Perplexity 会先访问并学习互联网上最有价值的相关内容,再围绕问题生成回答,同时也会提供来源以供验证。所以就算都是基于 GPT-4,比起 ChatGPT,Perplexit 往往更聚焦在问题上,信息也更准确。 在 Copilot 模式下,Perplexity 还会帮助用户明确问题来缩小查询范围,以此提高回答的精确度。此外,Perplexity 也在很早就设计了「追问」,沿着之前的问题和回答,用户可以在此基础上基于提问。 在底层,Perplexity 也一直在更新和增加更先进的大模型,从最早的 GPT-3 升级到 GPT-3.5 以及 GPT-4,从 GPT 扩展到 Claude、Gemini 以及 Mistra Large 等模型,他们还基于 Llama 2、Gemma 以及开…

    2024-03-15 数字经济
    21.6K
  • 苹果MacBook“先折为敬”,折叠屏笔记本是伪命题吗?

    (图源:MacStories) 文 | 雷科技leitech 如今,折叠屏早已是智能手机中重要的细分品类。这种有别于传统直板机的新形态产品,正成为各大手机厂商抢占品牌高地、冲击高端市场的关键武器。除了手机,折叠屏笔记本、折叠屏平板的概念和产品也在逐渐出现。 最近,知名苹果爆料人郭明錤透露,目前唯一有明确开发进度的苹果可折叠产品为MacBook,它将配备一块20.3英寸的大屏幕。 可折叠笔记本,是不是伪命题? 笔记本天生可折叠,但这里的“折叠”是值“合上盖子”,让主机与屏幕贴合。而“可折叠笔记本”所说的,则是值笔记本的屏幕本身可折叠。 其实这不是特别新颖的概念,比如华硕推出了灵耀X Fold,主打折叠屏卖点。具体来说,这款笔记本大体仍然是二合一产品(笔记本与平板二合一)的设计思路,它的实体键盘部分和屏幕是分开的。同时,灵耀X Fold的屏幕部分,可以折叠。 (图源:华硕) 灵耀X Fold用了一块17.3英寸的OLED屏幕,展开状态下用起来和一般的笔记本无异。而在折叠状态下,屏幕尺寸将变成12.5英寸,既可以以平板形态使用,也可以作为一半用于屏幕显示、另一半充当屏幕虚拟键盘的12.5英寸笔记本使用。 另一家PC巨头联想也推出过折叠屏笔记本,代表产品为ThinkPad X1 Fold。它的产品形态和设计思路与灵耀X Fold很类似,也是二合一产品的变种。ThinkPad X1 Fold用了一块16.3英寸的OLED屏幕,折叠状态下有12英寸的显示面积。 (图源:联想) 从这两家品牌的折叠屏笔记本来看,它们采用的相应技术其实是比较成熟的,基本就是对原有的二合一PC进行升级,屏幕部分则是OLED+铰链的解决方案。 而在雷科技(ID:leitech)看来,折叠屏MacBook也会采取类似的硬件设计思路。相比折叠屏手机,折叠屏笔记本上的一大问题是对实体键盘的处理。为了保证输入效率,折叠屏笔记本很难把实体键盘直接去掉,因此只能对它采取可分离设计。 其实跟折叠屏手机一样,折叠屏笔记本电脑解决的核心问题也是“便携性与大屏幕”的统一。用户想要带着大屏幕出门,但又不想它占据太多空间,因此“可折叠”就成了理想方案。 折叠屏MacBook,最大挑战是系统 相比Windows阵营,苹果的情况有些特殊,目前苹果还没有推出过二合一的MacBook产品。如果苹果要推出二合一形态的折叠屏笔记本,那么首先要解决的估计是系统和软件问题。 一直以来,苹果对于笔记本触控屏持抵触态度。尽管iPadOS一直在macOS化,二者越来越接近,但它们仍然是两款截然不同的操作系统,底层交互逻辑和软件生态都不是一回事。 当然,理论上苹果可以坚持不为折叠屏MacBook的屏幕提供触控交互功能。但这样一来,折叠屏笔记本的使用场景就会被大大局限。本来,可拆卸屏幕能够以平板的形态独立使用,大大增加了折叠屏笔记本的卖点。如果没有触控功能,那么折叠屏MacBook的卖点可能只剩下超大屏幕这一项,对用户的吸引力会很有限。 值得一提的是,最近小雷在一个苹果社区看到用户Federico Viticci的一项有趣“发明”。他将没有屏幕的“断头”MacBook和iPad搭配使用,利用Sidecar功能将iPad变成MacBook的无线屏幕。这样一来,他就获得了一款DIY版的二合一MacBook。美中不足的是,Sidecar功能需要两台设备接入同一局域网,出门在外用起来不太方便。 在小雷看来,苹果完全可以借鉴这一思路。如今,全系Mac完成了向ARM自研芯片平台的迁移,将macOS和iPadOS打通并非难事。毕竟,现在我们已经能在MacBook上使用大量iPad和iPhone应用了。而且相比Windows阵营,苹果对自家的M系列芯片有更强的控制权,它在发热和功耗控制上也很有优势,非常适合应用在折叠笔记本这类对空间要求更严格的产品上。 而一旦苹果让macOS支持触控功能,那么折叠屏MacBook的可玩性将会大大增加。 折叠屏iPhone跳票,MacBook“先折为敬” 小雷认为,苹果旗下的折叠产品的出现顺序会是折叠屏MacBook、折叠屏iPad和折叠屏iPhone。我们都知道,苹果一直以来都更倾向于推出成熟的商业产品,不太热衷于抢先发布搭载前沿技术但成熟度不高的先锋产品。手机当前仍是苹果的支柱业务,苹果对用iPhone来试水折叠屏设备自然会有很多顾虑。而MacBook产品上,这种顾虑就会少很多。 不同于手机,PC市场本身的容量就很小。而且,在PC行业中,苹果的出货量排名并不算高。近年,Mac业务经营得也不是特别理想。以2024财年Q1财报来说,苹果Mac营收为77.8亿美元,在整体营收中的占比约为6.5%。这样一来,苹果更有动力在MacBook上试水折叠屏技术。 我们可以发现,目前主流的折叠屏笔记本方案,本质上和折叠屏平板并无区别。只是,折叠屏笔记本比折叠屏平板多了一个外接的实体键盘。同样的,既然苹果打算发布折叠屏MacBook,那么再推出折叠屏iPad也是顺水推舟的事情。 此前,供应链一直有消息传出,苹果的MacBook和iPad产品线都将逐渐OLED化,这自然有利于后续相应折叠屏设备的出现。苹果当前最高端的平板产品iPad Pro,最大尺寸为12.9英寸,如果屏幕显示面积要进一步突破,那么走向折叠屏形态是必然的趋势。 (图源:苹果) 至于大家更加关注的折叠屏iPhone,也有一些消息了。早年去年年底,韩国媒体AlphaBiz就报道称,苹果高管透露,折叠屏iPhone预计于2026年发布。只是,这则消息还没得到其他信源共同印证。 折叠屏手机最关键的两项技术一个是屏幕,另一个是铰链,前者对苹果来说难度不大,后者则可能需要通过折叠屏MacBook、折叠屏iPad来积累经验。当前折叠屏手机的出货量占比仍然较低,距离大范围普及还有很长一段路要走,折叠屏iPhone未来仍然有一定机会。 当然,小雷也认为,苹果在iPhone产品上的常年摆烂,会影响折叠屏iPhone的竞争力。现在,各大厂商都在折叠屏手机上争奇斗艳,但共同的产品进化方向都是在保持折叠屏特殊优势的基础上,不断提升基本功。 换言之,早期折叠屏的优势就是可折叠本身,但在影像、续航、可靠性、价格等各方面都落后于传统直板旗舰。现在,华为、小米、OPPO等头部品牌,都在不断增强折叠屏的影像能力,通过更好的铰链技术来增强可靠性。折叠屏手机正在逐渐完成从“帐篷型”产品向“水桶型”产品的转变。 而作为常规旗舰的iPhone,则已经在散热、信号、影像、充电等方面落后于安卓机型。比如iPhone 15 Pro的发热、续航差问题,很大程度上源自苹果散热设计不思进取。如果现在苹果贸贸然推出一款折叠屏iPhone,大概率在影像、信号、性能稳定性等方面表现糟糕。在做出足够出色的折叠屏手机前,苹果还有很多课要补。 万物可折叠,但折叠屏笔记本不会成主流 从2007年初代iPhone发布开启触屏智能手机时代开始,智能手机的基础形态就没有改变过。在手机厂商穷尽了增加屏幕尺寸的常规手段后,折叠屏这种新形态方案就成了次世代手机的进化趋势。 而对于笔记本产品,它们向折叠屏形态演化的必要性则要小很多。毕竟,笔记本本身的屏幕尺寸要比手机大得多,而且它对便携性的要…

    2024-03-15 数字经济
    21.7K
  • Sora为何没能诞生在中国?

    没声音,再好的戏也出不来。 图片来源:由无界AI生成 在提示框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。 北京时间3月10日,硅谷一家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。 今年2月16日,OpenAI发布文字生成视频的大模型Sora。根据简单几句提示,Sora便能准确“理解”文本,生成长达60秒的视频,引发全球关注。一些业内人士将Sora的问世称为视频生成领域的“ChatGPT 时刻”。当地时间3月8日,历经几个月的“宫斗”大戏后,OpenAI的创始人山姆·奥特曼重回董事会,继续推进公司实现通用人工智能(AGI)的使命。 Sora的横空出世到底意味着什么,我们距离AGI还有多远,AI的下一步将走向何方?  “大力出奇迹”的再次验证 发布Sora之前,OpenAI并未向外界透露入局文生视频的想法。直到今年年初,全球文字生成视频赛道的焦点,仍集中在Pika、Runway、Stability AI等初创企业身上。 去年11月底,Pika初代文生视频产品发布,用户输入关键词“马斯克穿着太空服,3D动画”,卡通版的马斯克随即出现,在他身后,美国太空探索技术公司(SpaceX)的火箭升入空中,视频只有三四秒,清晰度和流畅度已远超其他产品。彼时,Pika联合创始人孟晨琳接受采访时分析说,“为什么GPT没有用于视频,可能因为他们的资源、人力都集中到了文本模型上。” 两个多月后,Sora惊艳亮相。其技术负责人最新展示的视频中,输入“穿越博物馆的飞行之旅,沿途欣赏众多绘画、雕塑以及各式各样的美丽艺术作品”,AI便生成60秒的长视频,人们跟随镜头,从空中俯冲至博物馆内,在多个画廊、房间穿梭,还会从雕塑边擦身而过。 新加坡南洋理工大学计算机学院助理教授刘子纬对《中国新闻周刊》说,OpenAI入局文生视频赛道,并不令人意外。OpenAI始终标榜要实现通用AGI。“朝着AGI发展,AI不仅要‘读万卷书’,还要看到世界上的种种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。” Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字和图片,AI视频生成的技术难度最大,对视频数据的分辨率、内容流畅度、一致性要求高,算力需求大。Sora之前,市面上的同类型产品,大多生成的视频清晰度不高,还会出现画面闪烁、人物变形的情况。Sora生成的视频能保持很好的三维一致性。生成的内容,比如水、云的运动,小鸟在林中飞翔等,主体与环境的交互能一定程度上展现物理世界的真实性。 OpenAI在其官网发布的Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模型,此前在图片生成领域已展现出强大能力,能生成逼真且高质量的图片。Transformer是GPT这类大语言模型的基础架构。ChatGPT能对答如流,便是因为这一架构能通过预测下一个token(文本的最小单元)出现的概率,更好捕捉上下文信息,生成更符合逻辑的文本。 清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆分成patch(视觉补丁,相当于token),然后直接输入模型学习。OpenAI官方介绍,Sora可以采样宽屏1920x1080p、垂直屏1080x1920p及介于两者间的所有视频。此外,OpenAI还为训练的视频集中生成字幕,可以提高文本保真度及视频的整体质量。 但业内共识是,DiT模型是个公开的秘密,底层技术上,Sora并没有创新。早在2022年年底,DiT就被提出。当时,美国加利福尼亚大学伯克利分校博士生威廉·皮布尔斯和纽约大学计算机学院助理教授谢赛宁联合发表论文,在文生图领域,创造性地将Transformer与Diffusion融合,一度引发学界轰动。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。” Sora官网发布的部分由文字生成的视频(截图) 彼时,文生视频模型有多条技术路径,但受限于算力和数据,DiT路径尚未走通,学术团队和创业公司难以全力投入。OpenAI选择了一条少有人走的路。在刘子纬看来,“Sora背后,与其说是模型的突破,不如说是OpenAI大模型系统设计的胜利”。大模型系统设计,涵盖训练数据的细节,OpenAI在算力、人才组织架构上的积累等。这些因素最为关键,但OpenAI在公开信息中几乎只字未提。 Sora复制了ChatGPT的成功经验,再次验证了“大力出奇迹”的暴力美学,以及OpenAI“遇事不决,扩大模型”核心价值观的可行性。在清华大学计算机系副教授、人工智能初创公司壁智能联合创始人刘知远看来,Sora像是AI视频生成的“GPT-3时刻”,它证明数据的价值,高质量、大规模的数据能训练出一个文生视频模型。 中国科学院深圳先进技术研究院数字所研究员董超长期研究底层机器视觉,目前,正与团队研发多模态模型。他向《中国新闻周刊》强调,选取哪些数据、如何筛选、如何标注,直接影响模型生成的效果。想要大模型生成高质量的视频,要求训练数据分辨率高,场景细节丰富,人、物、景占比协调等,如果一些场景转场太快,也要被剔除。 Pika联合创始人孟晨琳也提到,一些电影中有很多漂亮的视频,但如果大部分都是人站着说话,动作单一,也不是训练大模型的优质数据。此外,版权问题,也会影响企业收集到足够多高质量的视频。 在董超看来,数据背后,人才团队极为重要,“大模型的训练绝不是看上去那么简单,没有经验根本调不通,通常要团队里最优秀的人来做这件事。国外许多科技公司的顶尖AI人才,都会在一线亲自处理数据,写代码”。 据OpenAI官网介绍,Sora的核心团队共15人。公开资料显示,团队的成立时间尚未超过1年,三位研发负责人中,两人都是2023年从加利福尼亚大学伯克利分校博士毕业,其中一人便是前述DiT论文的作者之一威廉·皮布尔斯,另一位蒂姆·布鲁克斯曾在谷歌工作近两年,在伯克利读博期间,主要研究方向就是图片与视频生成。布鲁克斯和另外一位研发负责人阿迪亚·拉梅什都是OpenAI开发的文生图模型DALL-E 3的创造者。 从GPT-3、GPT-3.5再到GPT-4,OpenAI积累了丰富的大数据训练、生成与治理能力,这是支持Sora的“基础设施”。“Sora团队只有十几人,就说明,OpenAI给他们提供了重要的底层支持,组织架构、人才管理、基础设施,这才能让有想法的人,真正做出能影响世界的成果。”刘子纬对《中国新闻周刊》说…

    2024-03-15 数字经济
    10.8K

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注