魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

近两年,智能手机市场一直处于下行通道。来自多家机构发布的数据均显示,即便是去年四季度有所回暖,整年的数据仍旧是负增长。在换机周期已经增至51个月的当下,手机市场需要一个新的变量,去刺激一下这沉闷的行业。目前来看,AI是所有手机厂商公认的答案。

春节过后,多家国产手机品牌宣布“All in AI”,其中魅族显得更为激进,直言“停止传统’智能手机’新项目”,全面拥抱AI。未来的方向和别的手机厂商也有所不同,不是围绕手机做+AI,而是围绕AI去做新的平台、新的硬件。

2月29日,魅族借着魅族 21 PRO 的发布,进一步透露了“All in AI”战略规划的详细内容。值得一提的是,相比较AI手机的叫法,魅族将21 PRO定义为“开放式AI终端”,从这一定位也能看出魅族在AI时代的突围逻辑和方向。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

“AI终端爆发的时间点我个人觉得应该在明年和后年”,在星纪魅族集团董事长兼CEO沈子瑜看来,经过两年的团队磨合、资源配置、产品布局以及相关技术的充分预研,魅族目前已具备向AI领域全面转型的能力。“魅族AI Device将改变硬件的形态,让用户感受到我们终端是不一样的,这才是价值所在。”

传统智能手机时代的“句号”,重回国内中高端前五目标不变

2023年,在星纪魅族集团成立之际,沈子瑜曾对钛媒体App透露,“三年重回全国中高端市场前五的位置并占据一席之地。”同时,对于魅族的产品线,沈子瑜也定下了基调,未来会专注在中高端市场进行深耕。

值得注意的是,作为魅族定义的传统智能手机时代的最后一款产品,在魅族21 PRO的发布会上,李楠和杨颜这两位元老“回归”,作为宣讲嘉宾,将很多魅友带回了那个闪耀的时代。

不过,消费市场,产品力才是核心。钛媒体App发现,作为一款旗舰机,魅族21 PRO在硬件上也是堆了不少料,但是在很多消费者看来,不同于友商着重发力的点,魅族更是在一些看似不起眼的地方下了大功夫。

对此,沈子瑜向钛媒体App解释道,“这就是魅族细节性的体现,在细节控制上友商和我们有较大的差距”。比如大面积超声波指纹识别,解锁面积从8mm*8mm提升至30mm*20mm,解锁面积比魅族20 PRO大出9倍,能带来更加便捷和舒适的交互体验,提升用户的使用效率。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

作为回归后的品牌大使,李楠则给出了更高的评价,公开表示“魅族21 PRO就是一个价格更合理的苹果,或者是更有品味的小米,或者是系统更优雅,更强大,更接地气的三星”。

根据官方公开的数据,魅族21 PRO首销当天达成魅族20 PRO同期销量的166%,在京东以及天猫电商平台上,收获5000元价位段的销量和销售额双冠军。

交互体验是核心,要做AI时代的“树莓派”

作为传统智能手机时代的“句号”,魅族21 PRO还有一个新的定语—开放式AI终端。在魅族的定义中,魅族21 PRO是其踏入AI时代的开端,也是AI时代定位的体现。

“之所以21 PRO晚了四个月,就是因为我们要把FlymeOS AI的version做出来。”

其实,对于魅族转向AI的战略和态度,外界一直是比较吃惊。毕竟许多头部品牌的动作都相对保守,但魅族则显得很激进,甚至比当初从MP3转向智能手机时代更为激进。关于这一点,钛媒体App认为,主要核心还是两个,一是AI时代的变革不容迟疑,二是魅族要弯道超车,只能更彻底,而不是瞻前顾后。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

IDC预计,2024年中国市场上搭载AI功能终端设备将超70%,AI终端占比将达55%。与此同时,2024年全球新一代AI手机的出货量将达到1.7亿部,约占智能手机整体出货量的15%。沈子瑜认为,AI终端爆发的时间点应该在明年和后年,未来十年AI终端也将会是用户的超级入口,整个交互体验需要有革命性创新。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

根据魅族公布的“All in AI”战略来看,其核心包含三个方面:打造AI Device产品、重构Flyme系统和建设AI生态。其中,魅族AI Device包括产品形态AI原生设计、硬件算力AI全局调用等,重点在重构硬件的产品形态;Flyme系统将从底层重构系统及应用,从而让AI技术能够更深入地融入操作系统中;魅族还将重点建设AI生态,换句话说就是向OpenAI在内的众多国际顶级大模型团队全面开放魅族AI Device硬件。

AI浪潮下,交互方式正迎来根本性的变革,无论是硬件、系统还是生态未来围绕的都是交互。“我们终端公司解决的是人机交互体验,所以说交互体验决定了软件架构,决定了硬件和软件的系统包,以及决定了我们的服务接入”,沈子瑜说道。

交互的第一手是硬件,在他的设想中,AI Device的硬件形态是要一拿起来就让用户能够跟AI Agent去沟通,而不是去打开App。交流中,沈子瑜还透露,魅族 AI Device完全就会是硬件上的重构,从零开始,形态会发生变化。

确立了交互在AI时代的地位,Flyme自然就成为魅族AI化后的关键,这也是AI时代操作系统的基建能力。目前,AI能力已经在Flyme 10.5上有所展现,比如Flyme的Aicy语音助手等,更多的功能也在测试中。

作为魅族AI战略的决策者,沈子瑜也是进一步确认了Flyme的核心地位,“Flyme 一直是人机交互体验的领导者,现在Flyme要AI化,要把领先的体验和设计做出来,并且在AI上面做出我们的创新。”

为了打造AI系统新体验,除了魅族自身的投入肯定是不够的。开放合作是必做题,这也是魅族在宣布全面拥抱AI之前就想清楚的问题——做平台,定位开放式AI,做AI时代的“树莓派”,通过AI的能力把硬件的权限和能力赋予给服务商、用户。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

在这个思路下,魅族将不仅对软件开发者开放,允许LLM向用户请求数据,并开放SOC边缘AI API等技术接口。还对所有大模型都提供了系统权限、Flyme API文档等支持,针对月活跃用户数最高的大模型应用团队还设立高达100万人民币的悬赏机制。

“因为是我们是硬件厂商,FlymeOS AI就是把硬件能力转化成软件能力给到HMI,叫操作系统化。同时,也要让第三方的AI Agent进来,就像你的助理,有的助理可能是文笔比较好,另外一个助理更擅长社交,每一个场景下都能够有最适合的那个助理。”

不过,钛媒体App认为,对于硬件厂商,如何把握开放权限的度是关键,主动权的把控会是一个不稳定因素,这需要和服务商去交涉,去谈判。毕竟,无论是传统智能手机时代,还是AI时代,用户是核心,平台和服务商之间的利益冲突不能损害用户的利益。

做减法和聚焦,还要做AI时代的“灯塔”

星纪魅族成立的这一年,中间有过多次调整。现如今,在AI战略下,魅族要做的是减法和聚焦,聚焦在以AI为核心的能力构建上。

魅族「终结」传统智能手机后,沈子瑜预测AI终端将在明后年爆发

按照规划,魅族将通过三年的生态布局和技术沉淀,逐步完成All in AI愿景。今年的重点是构建起AI时代操作系统的基建能力,并计划在今年美国黑色星期五期间,发布魅族首款AI Device产品。

沈子瑜表示,首款AI Device产品也是强调AI的交互能力,魅族要做的事是基于一个开放的底座,把整个生态的Agent接进来,这也意味着 FlymeOS AI化以后整个的工作量会比较大。“其实要做的就是把整个软件架构重构,交互体验也重构。”

不过,基于AI生态研发理念的转变并不是那么容易,AI Device和传统智能手机在屏幕、交互都有着很大的区别。但即便这样,沈子瑜依旧对他的团队很有信心,目标要从智能手机时代的体验领导者转化成AI时代的体验领导者。

激进,才有弯道超车的机会。如果马斯克是个冷静的普通人,也不可能重新定义电动车。从MP3时代到智能手机时代,一路起伏,AI是重回主舞台的又一次机遇。只是,要继续做AI时代的灯塔,并非易事,改变硬件的形态以及建立开放的生态也是更大的挑战,如何能让用户感受到不一样的终端体验,这才是价值所在。

目前,离年底只有不到十个月的时间,魅族的第一款AI Device究竟表现如何,届时市场也会用销量给出答案。(本文首发钛媒体App,作者/杜志强,编辑/钟毅)

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:Metatrend元潮

Like (0)
Previous 2024-03-15
Next 2024-03-15

相关推荐

  • 飒姐团队 | DAO,可以在中国合法经营吗?

    我们在之前的文章中提到过DAO(详见《DAO,会是未来的新型“公司”吗?》),DAO是一种特殊的组织形态,其以智能合约作为最高章程,控制整个DAO的运营。组织中没有中心化的管理结构,一切都是透明、民主的。那么,DAO能否在中国合法经营?今天飒姐法律团队就以此为视角,来和大家聊一聊。 境外DAO与现有制度之比较 最早的一个DAO出现在2016年。全称为“The DAO”,一开始它只是一个ico投资工具,旨在以理性的方式筹集资金、建立一个去中心化的风险基金,The DAO通过发行自己的DAO token以换取ETH作为自己的资金。Token代表了持有者在The DAO中的经济利益以及投票权。但在2017年,由于一个严重的智能合约漏洞导致DAO合约中的ETH被攻击者盗走,失去了资金的The DAO无法再维持运营,其概念也就随之沉寂。 随着时间的发展,DAO的价值也逐渐被发掘,时至2021年末,基本上万物皆可DAO,从社交类Friends With BenefitsDAO,到企图购买美国某1787重要法律文件的ConstitutionDAO,以及想买下NBA球队特许经营权的Krause HouseDAO。世界之大,只要有共同的需求和想法,任何群体都能组建一个DAO。 今天我们就从现有制度出发,通过对比传统公司制度与DAO之间的区别,探讨其在中国法律框架内合规的可能性。 (一)公司与DAO之比较 公司制是现代商业最伟大的创设之一,依据《公司法》,我国现代公司制企业的主要形式是有限责任公司和股份有限公司。公司制的特点是公司的资本来源广泛,使大规模生产成为可能;出资人对公司只负有限责任,投资风险相对降低;公司拥有独立的法人财产权,保证了企业决策的独立性、连续性和完整性;所有权与经营权相分离。 根据我国《公司法》第三条对公司的定义:公司是企业法人,有独立的法人财产,享有法人财产权。公司以其全部财产对公司的债务承担责任。有限责任公司的股东以其认缴的出资额为限对公司承担责任;股份有限公司的股东以其认购的股份为限对公司承担责任。 根据美国DAO法案,DAO属于有限责任公司limited liability company(LLC),我们今天就借LLC来与现有公司制度进行对比。LLC与DAO最大的特点就是企业成员间具有有限的个人责任和成员管理义务,也就是说,这些成员只承担自己的过失责任,而不会承担企业或其他成员的过失责任。LLC的成员既是公司中的股东,又是LLC的成员和雇员,每个成员都有相同的投票权。但有时会从成员中选出稍有管理经验的成员代表(managing member)来进行管理。 LLC的决策权和投票权都取决于成员占有的股权比例,大多数情况下,每个成员的股权比例相同,因此他们的决策和投票权也是相同的。但在某种情况下,根据各成员对LLC的出资量不同,这些成员所占的股权比例也会不同,决策权和投票权与他们占有的股权比例相对应。目前在DAO的发展中也已经出现了成员代表管理的大小不等的股权和决策权。 可以说,DAO是一种兼具有限责任制和合伙制的商业架构,比传统公司制度更加灵活。除智能合约与公司章程之间的区别、中心化管理和去中心化管理的区别外,DAO成员在组织中拥有比传统公司成员更多的话语权,其大多数时候并不因自己所占股权比例的大小而丧失自己的声音。 (二)合伙制与DAO之比较 笔者个人认为合伙制是当前我国与DAO最为相似的商业架构。关于合伙企业的定义与合伙成员责任制度,依据《合伙企业法》第二条之规定:本法所称合伙企业,是指自然人、法人和其他组织依照本法在中国境内设立的普通合伙企业和有限合伙企业;普通合伙企业由普通合伙人组成,合伙人对合伙企业债务承担无限连带责任。本法对普通合伙人承担责任的形式有特别规定的,从其规定;有限合伙企业由普通合伙人和有限合伙人组成,普通合伙人对合伙企业债务承担无限连带责任,有限合伙人以其认缴的出资额为限对合伙企业债务承担责任。 LLC和DAO的特征已经在前面说过,这里就不再赘述,比较DAO和合伙企业制我们可以发现他们的诸多共同点,其一是“成员治理”,根据《合伙企业法》第二十六条:合伙人对执行合伙事务享有同等的权利。按照合伙协议的约定或者经全体合伙人决定,可以委托一个或者数个合伙人对外代表合伙企业,执行合伙事务。 此处DAO同样遵循该规则,每个成员都是DAO的股东又同时可以说是DAO的雇员,在未将经营权、管理权外包之前,每个合伙人都可平等的执行合伙企业事务,从这一点上来说正是“去中心化”思想的体现。其二是税收监管方面,根据《合伙企业法》第六条:合伙企业的生产经营所得和其他所得,按照国家有关税收规定,由合伙人分别缴纳所得税。DAO同样是由成员各自缴纳所得税,而不以组织为单位纳税。 说到二者最大的区别,就是责任承担形式的不同。在我国的普通合伙制度中,合伙人全体必须对合伙企业的债务承担无限连带责任。有限合伙虽然受有限责任的保护,但有限合伙人不得参与合伙企业的经营管理活动,没有发言权。 通过对合伙、公司制度和DAO(LLC)的比较,我们可以得出结论:DAO事实上就是拥有决策权的有限合伙人。如果作为中小投资者,一方面不愿如合伙一样,对债务承担无限连带责任,而希望享受像公司那样的有限责任保护;另一方面,不愿像一般公司的股东那样不得直接插手公司事务,期望自己能够像合伙人一样参与企业的经营;DAO(LLC)似乎是最好的选择。可惜的是我国并没有建立LLC制度。 DAO组织可以在我国合法经营吗? 在现有的法律规范体系内看,这是非常困难的,关键在于我国并没有规定这样一种特殊的商业架构。想既受到有限责任制的保护,同时全体成员又拥有与合伙企业相同的经营权在当前属于“鱼和熊掌”的问题。普通合伙人之所以对合伙企业承担无限连带责任是因为根据法律规定,合伙企业不具有法人资格,也就是说它不是法律意义上的“人”。 法人资格是有限责任制的核心,很多人存在一个误区:有限公司承担的是有限责任。其实不尽然,有限公司作为一个有独立资产的法人,其本身对债务承担的是无限连带责任。如果公司不具有法律上的人格,则不具有权利能力,没有自己的财产,也就无法独立承担民事责任。 因此,合伙企业的债务,实际上是由合伙人承担的,对合伙人表现为无限责任,即合伙人要以其所有的财产承担合伙企业的债务。 再来说以公司为代表的企业法人,这类主体被法律拟制为“人”,可以拥有自己的财产(出资财产属于法人所有,不再属于出资人),能够独立承担民事责任。所以出资人的无限连带责任实际是被公司法人承担了。而合伙制企业不具有法人资格,因此合伙企业的债务须由合伙人承担。这也是法律出于对债权人利益的保护之考量。 因此,对于DAO来说至关重要的有限责任制在我国并不存在。根据我国《公司法》和《中华人民共和国公司登记管理条例》规定,我国公司法人格的取得采登记制,也就是说,是否具有法人资格的关键在于是否等取得工商行政主管部门的登记。在法律体系外的DAO显然是不可能做到的,因此,DAO在我国有很大可能性会被视为合伙企业。 DAO在我国经营的刑法风险 任何一个组织要进行正常经营都离不开筹集资金(资本)这一前置条件,DAO也不例外。由于DAO的核心智能合约是诞生于区块链技术的产物,其天生与虚拟货币、N…

    2021-12-28
    57.0K
  • 苹果MacBook“先折为敬”,折叠屏笔记本是伪命题吗?

    (图源:MacStories) 文 | 雷科技leitech 如今,折叠屏早已是智能手机中重要的细分品类。这种有别于传统直板机的新形态产品,正成为各大手机厂商抢占品牌高地、冲击高端市场的关键武器。除了手机,折叠屏笔记本、折叠屏平板的概念和产品也在逐渐出现。 最近,知名苹果爆料人郭明錤透露,目前唯一有明确开发进度的苹果可折叠产品为MacBook,它将配备一块20.3英寸的大屏幕。 可折叠笔记本,是不是伪命题? 笔记本天生可折叠,但这里的“折叠”是值“合上盖子”,让主机与屏幕贴合。而“可折叠笔记本”所说的,则是值笔记本的屏幕本身可折叠。 其实这不是特别新颖的概念,比如华硕推出了灵耀X Fold,主打折叠屏卖点。具体来说,这款笔记本大体仍然是二合一产品(笔记本与平板二合一)的设计思路,它的实体键盘部分和屏幕是分开的。同时,灵耀X Fold的屏幕部分,可以折叠。 (图源:华硕) 灵耀X Fold用了一块17.3英寸的OLED屏幕,展开状态下用起来和一般的笔记本无异。而在折叠状态下,屏幕尺寸将变成12.5英寸,既可以以平板形态使用,也可以作为一半用于屏幕显示、另一半充当屏幕虚拟键盘的12.5英寸笔记本使用。 另一家PC巨头联想也推出过折叠屏笔记本,代表产品为ThinkPad X1 Fold。它的产品形态和设计思路与灵耀X Fold很类似,也是二合一产品的变种。ThinkPad X1 Fold用了一块16.3英寸的OLED屏幕,折叠状态下有12英寸的显示面积。 (图源:联想) 从这两家品牌的折叠屏笔记本来看,它们采用的相应技术其实是比较成熟的,基本就是对原有的二合一PC进行升级,屏幕部分则是OLED+铰链的解决方案。 而在雷科技(ID:leitech)看来,折叠屏MacBook也会采取类似的硬件设计思路。相比折叠屏手机,折叠屏笔记本上的一大问题是对实体键盘的处理。为了保证输入效率,折叠屏笔记本很难把实体键盘直接去掉,因此只能对它采取可分离设计。 其实跟折叠屏手机一样,折叠屏笔记本电脑解决的核心问题也是“便携性与大屏幕”的统一。用户想要带着大屏幕出门,但又不想它占据太多空间,因此“可折叠”就成了理想方案。 折叠屏MacBook,最大挑战是系统 相比Windows阵营,苹果的情况有些特殊,目前苹果还没有推出过二合一的MacBook产品。如果苹果要推出二合一形态的折叠屏笔记本,那么首先要解决的估计是系统和软件问题。 一直以来,苹果对于笔记本触控屏持抵触态度。尽管iPadOS一直在macOS化,二者越来越接近,但它们仍然是两款截然不同的操作系统,底层交互逻辑和软件生态都不是一回事。 当然,理论上苹果可以坚持不为折叠屏MacBook的屏幕提供触控交互功能。但这样一来,折叠屏笔记本的使用场景就会被大大局限。本来,可拆卸屏幕能够以平板的形态独立使用,大大增加了折叠屏笔记本的卖点。如果没有触控功能,那么折叠屏MacBook的卖点可能只剩下超大屏幕这一项,对用户的吸引力会很有限。 值得一提的是,最近小雷在一个苹果社区看到用户Federico Viticci的一项有趣“发明”。他将没有屏幕的“断头”MacBook和iPad搭配使用,利用Sidecar功能将iPad变成MacBook的无线屏幕。这样一来,他就获得了一款DIY版的二合一MacBook。美中不足的是,Sidecar功能需要两台设备接入同一局域网,出门在外用起来不太方便。 在小雷看来,苹果完全可以借鉴这一思路。如今,全系Mac完成了向ARM自研芯片平台的迁移,将macOS和iPadOS打通并非难事。毕竟,现在我们已经能在MacBook上使用大量iPad和iPhone应用了。而且相比Windows阵营,苹果对自家的M系列芯片有更强的控制权,它在发热和功耗控制上也很有优势,非常适合应用在折叠笔记本这类对空间要求更严格的产品上。 而一旦苹果让macOS支持触控功能,那么折叠屏MacBook的可玩性将会大大增加。 折叠屏iPhone跳票,MacBook“先折为敬” 小雷认为,苹果旗下的折叠产品的出现顺序会是折叠屏MacBook、折叠屏iPad和折叠屏iPhone。我们都知道,苹果一直以来都更倾向于推出成熟的商业产品,不太热衷于抢先发布搭载前沿技术但成熟度不高的先锋产品。手机当前仍是苹果的支柱业务,苹果对用iPhone来试水折叠屏设备自然会有很多顾虑。而MacBook产品上,这种顾虑就会少很多。 不同于手机,PC市场本身的容量就很小。而且,在PC行业中,苹果的出货量排名并不算高。近年,Mac业务经营得也不是特别理想。以2024财年Q1财报来说,苹果Mac营收为77.8亿美元,在整体营收中的占比约为6.5%。这样一来,苹果更有动力在MacBook上试水折叠屏技术。 我们可以发现,目前主流的折叠屏笔记本方案,本质上和折叠屏平板并无区别。只是,折叠屏笔记本比折叠屏平板多了一个外接的实体键盘。同样的,既然苹果打算发布折叠屏MacBook,那么再推出折叠屏iPad也是顺水推舟的事情。 此前,供应链一直有消息传出,苹果的MacBook和iPad产品线都将逐渐OLED化,这自然有利于后续相应折叠屏设备的出现。苹果当前最高端的平板产品iPad Pro,最大尺寸为12.9英寸,如果屏幕显示面积要进一步突破,那么走向折叠屏形态是必然的趋势。 (图源:苹果) 至于大家更加关注的折叠屏iPhone,也有一些消息了。早年去年年底,韩国媒体AlphaBiz就报道称,苹果高管透露,折叠屏iPhone预计于2026年发布。只是,这则消息还没得到其他信源共同印证。 折叠屏手机最关键的两项技术一个是屏幕,另一个是铰链,前者对苹果来说难度不大,后者则可能需要通过折叠屏MacBook、折叠屏iPad来积累经验。当前折叠屏手机的出货量占比仍然较低,距离大范围普及还有很长一段路要走,折叠屏iPhone未来仍然有一定机会。 当然,小雷也认为,苹果在iPhone产品上的常年摆烂,会影响折叠屏iPhone的竞争力。现在,各大厂商都在折叠屏手机上争奇斗艳,但共同的产品进化方向都是在保持折叠屏特殊优势的基础上,不断提升基本功。 换言之,早期折叠屏的优势就是可折叠本身,但在影像、续航、可靠性、价格等各方面都落后于传统直板旗舰。现在,华为、小米、OPPO等头部品牌,都在不断增强折叠屏的影像能力,通过更好的铰链技术来增强可靠性。折叠屏手机正在逐渐完成从“帐篷型”产品向“水桶型”产品的转变。 而作为常规旗舰的iPhone,则已经在散热、信号、影像、充电等方面落后于安卓机型。比如iPhone 15 Pro的发热、续航差问题,很大程度上源自苹果散热设计不思进取。如果现在苹果贸贸然推出一款折叠屏iPhone,大概率在影像、信号、性能稳定性等方面表现糟糕。在做出足够出色的折叠屏手机前,苹果还有很多课要补。 万物可折叠,但折叠屏笔记本不会成主流 从2007年初代iPhone发布开启触屏智能手机时代开始,智能手机的基础形态就没有改变过。在手机厂商穷尽了增加屏幕尺寸的常规手段后,折叠屏这种新形态方案就成了次世代手机的进化趋势。 而对于笔记本产品,它们向折叠屏形态演化的必要性则要小很多。毕竟,笔记本本身的屏幕尺寸要比手机大得多,而且它对便携性的要…

    2024-03-15 数字经济
    21.8K
  • Sora为何没能诞生在中国?

    没声音,再好的戏也出不来。 图片来源:由无界AI生成 在提示框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。 北京时间3月10日,硅谷一家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。 今年2月16日,OpenAI发布文字生成视频的大模型Sora。根据简单几句提示,Sora便能准确“理解”文本,生成长达60秒的视频,引发全球关注。一些业内人士将Sora的问世称为视频生成领域的“ChatGPT 时刻”。当地时间3月8日,历经几个月的“宫斗”大戏后,OpenAI的创始人山姆·奥特曼重回董事会,继续推进公司实现通用人工智能(AGI)的使命。 Sora的横空出世到底意味着什么,我们距离AGI还有多远,AI的下一步将走向何方?  “大力出奇迹”的再次验证 发布Sora之前,OpenAI并未向外界透露入局文生视频的想法。直到今年年初,全球文字生成视频赛道的焦点,仍集中在Pika、Runway、Stability AI等初创企业身上。 去年11月底,Pika初代文生视频产品发布,用户输入关键词“马斯克穿着太空服,3D动画”,卡通版的马斯克随即出现,在他身后,美国太空探索技术公司(SpaceX)的火箭升入空中,视频只有三四秒,清晰度和流畅度已远超其他产品。彼时,Pika联合创始人孟晨琳接受采访时分析说,“为什么GPT没有用于视频,可能因为他们的资源、人力都集中到了文本模型上。” 两个多月后,Sora惊艳亮相。其技术负责人最新展示的视频中,输入“穿越博物馆的飞行之旅,沿途欣赏众多绘画、雕塑以及各式各样的美丽艺术作品”,AI便生成60秒的长视频,人们跟随镜头,从空中俯冲至博物馆内,在多个画廊、房间穿梭,还会从雕塑边擦身而过。 新加坡南洋理工大学计算机学院助理教授刘子纬对《中国新闻周刊》说,OpenAI入局文生视频赛道,并不令人意外。OpenAI始终标榜要实现通用AGI。“朝着AGI发展,AI不仅要‘读万卷书’,还要看到世界上的种种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。” Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字和图片,AI视频生成的技术难度最大,对视频数据的分辨率、内容流畅度、一致性要求高,算力需求大。Sora之前,市面上的同类型产品,大多生成的视频清晰度不高,还会出现画面闪烁、人物变形的情况。Sora生成的视频能保持很好的三维一致性。生成的内容,比如水、云的运动,小鸟在林中飞翔等,主体与环境的交互能一定程度上展现物理世界的真实性。 OpenAI在其官网发布的Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模型,此前在图片生成领域已展现出强大能力,能生成逼真且高质量的图片。Transformer是GPT这类大语言模型的基础架构。ChatGPT能对答如流,便是因为这一架构能通过预测下一个token(文本的最小单元)出现的概率,更好捕捉上下文信息,生成更符合逻辑的文本。 清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆分成patch(视觉补丁,相当于token),然后直接输入模型学习。OpenAI官方介绍,Sora可以采样宽屏1920x1080p、垂直屏1080x1920p及介于两者间的所有视频。此外,OpenAI还为训练的视频集中生成字幕,可以提高文本保真度及视频的整体质量。 但业内共识是,DiT模型是个公开的秘密,底层技术上,Sora并没有创新。早在2022年年底,DiT就被提出。当时,美国加利福尼亚大学伯克利分校博士生威廉·皮布尔斯和纽约大学计算机学院助理教授谢赛宁联合发表论文,在文生图领域,创造性地将Transformer与Diffusion融合,一度引发学界轰动。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。” Sora官网发布的部分由文字生成的视频(截图) 彼时,文生视频模型有多条技术路径,但受限于算力和数据,DiT路径尚未走通,学术团队和创业公司难以全力投入。OpenAI选择了一条少有人走的路。在刘子纬看来,“Sora背后,与其说是模型的突破,不如说是OpenAI大模型系统设计的胜利”。大模型系统设计,涵盖训练数据的细节,OpenAI在算力、人才组织架构上的积累等。这些因素最为关键,但OpenAI在公开信息中几乎只字未提。 Sora复制了ChatGPT的成功经验,再次验证了“大力出奇迹”的暴力美学,以及OpenAI“遇事不决,扩大模型”核心价值观的可行性。在清华大学计算机系副教授、人工智能初创公司壁智能联合创始人刘知远看来,Sora像是AI视频生成的“GPT-3时刻”,它证明数据的价值,高质量、大规模的数据能训练出一个文生视频模型。 中国科学院深圳先进技术研究院数字所研究员董超长期研究底层机器视觉,目前,正与团队研发多模态模型。他向《中国新闻周刊》强调,选取哪些数据、如何筛选、如何标注,直接影响模型生成的效果。想要大模型生成高质量的视频,要求训练数据分辨率高,场景细节丰富,人、物、景占比协调等,如果一些场景转场太快,也要被剔除。 Pika联合创始人孟晨琳也提到,一些电影中有很多漂亮的视频,但如果大部分都是人站着说话,动作单一,也不是训练大模型的优质数据。此外,版权问题,也会影响企业收集到足够多高质量的视频。 在董超看来,数据背后,人才团队极为重要,“大模型的训练绝不是看上去那么简单,没有经验根本调不通,通常要团队里最优秀的人来做这件事。国外许多科技公司的顶尖AI人才,都会在一线亲自处理数据,写代码”。 据OpenAI官网介绍,Sora的核心团队共15人。公开资料显示,团队的成立时间尚未超过1年,三位研发负责人中,两人都是2023年从加利福尼亚大学伯克利分校博士毕业,其中一人便是前述DiT论文的作者之一威廉·皮布尔斯,另一位蒂姆·布鲁克斯曾在谷歌工作近两年,在伯克利读博期间,主要研究方向就是图片与视频生成。布鲁克斯和另外一位研发负责人阿迪亚·拉梅什都是OpenAI开发的文生图模型DALL-E 3的创造者。 从GPT-3、GPT-3.5再到GPT-4,OpenAI积累了丰富的大数据训练、生成与治理能力,这是支持Sora的“基础设施”。“Sora团队只有十几人,就说明,OpenAI给他们提供了重要的底层支持,组织架构、人才管理、基础设施,这才能让有想法的人,真正做出能影响世界的成果。”刘子纬对《中国新闻周刊》说…

    2024-03-15 数字经济
    10.8K
  • 智能手机抢滩AI大模型的背后:发布会上雷声大,线下销售雨点小

    从2023年到2024年,随着新一波人工智能的浪潮的加速,消费电子产品也迎来了全新的话题——AI。 目前,华为、小米、荣耀、OPPO、vivo等手机厂商均已发布搭载了端侧大模型的旗舰新品。华为有盘古大模型、小米有MiLM、OPPO有安第斯大模型、vivo有AI蓝心大模型、荣耀有魔法大模型。这些个大模型先后随各自的新品手机发布,一时间变得广为人知。 其中最有代表性的,当属在智能手机领域沉寂已久的魅族。在春节假期之后官方宣布「停止传统智能手机新项目,全面拥抱AI」。随后发布的魅族 21 PRO,魅族方面甚至不称之为「手机」,而是所谓「开放式AI终端」。 应该说,近一年来AI手机乃至All in AI,几乎成为了智能手机厂商发布会的必选项。 图片来源:AI生成 市场调研机构Canalys最新显示预测,2024年全球智能手机出货总量中,预计约5%会搭载端侧AI运算能力。IDC中国区总裁霍锦洁表示,2024年全球新一代AI手机出货量将达到1.7亿部,占智能手机整体出货量的15%。中国市场AI手机份额也将迅速增长,到2027年将占比超过50%。 显然,无论厂商还是数据机构都对AI手机抱有希望。但在实际的销售环节,智能手机的「大模型热」,似乎表现出了另外一种状况。 发布会雷声大,销售端雨点小 钛媒体App 在2024年3月上旬,走访了北京多个商圈的十余家智能手机门店,品牌包括华为、小米、OPPO、vivo、荣耀,重点观察了线下渠道对于AI的展示和介绍,以及消费者的关注方向。 从结果来看,AI手机在线下门店的热度,远远不如更加热闹发布会。 小米曾在在发布会上宣称,小米14 Ultra是搭载AI大模型计算摄影平台,小米14 Ultra在进行30倍以上的变焦拍摄时,可以调用 AI 大模型对原始光学数据进行重绘,让模糊细节在算法的调教下变得清晰。 但在在钛媒体App走访的几家小米之家门店中,并未有关于AI方面的任何物料展示和介绍,店员关于手机影像也更多是围绕徕卡影调、长焦、四摄像头等传统配置层面的介绍,并没有关于AI部分的介绍。 在此前旗舰产品荣耀Magic6系列发布时,荣耀一同发布了搭载荣耀自研70亿参数端侧平台级AI大模型“魔法大模型”。荣耀CEO赵明表示过去几年,荣耀在AI上投入的成本加起来约百亿元,未来在AI上的投资还会加大。 华为此前也曾宣布HarmonyOS 4系统全面接入了自家的盘古大模型,成为全球首个嵌入AI大模型能力的移动终端操作系统,首批支持机型为Mate 60系列。 图片来源:AI生成 但从线下布置来看,荣耀和华为都没有把AI、大模型当作产品的重点进行展示,没有相关的宣传物料。在询问相关功能时,华为店员表示「只有小艺小艺,没有ChatGPT一类的大模型」。 vivo此前在开发者大会上发布了自研的AI蓝心大模型,vivo S18则是首批搭载AI蓝心大模型的产品,该功能支持用户查找文件、作诗写词、看文创图、总结内容、解答难题、整理材料框架等。 OPPO则是在开发者大会上宣布,Color OS14系统中将内置安第斯大模型(AndesGPT)。随后发布的OPPO Find X7是首个端侧应用70亿参数大语言模型的手机,通过端云协同,可带来全新的AIGC消除功能与首个AI大模型语音摘要。 从线下的实际情况来看,OPPO和vivo算是相对比较「上心」的厂商。 OPPO店内,产品一侧就有AI手机的字样,在被问到AI手机具体有什么功能时,店员重点展示AI消除功能,即在人像照片中,抹掉背景中的路人,并由AI实现扣去部分的补完,展示效果确实让人眼前一亮。 vivo店内,有着明显的说明牌,介绍「 蓝心小v」的AI功能,包括消除路人、搜索照片、用照片生成漫画、写诗以及常见的AIGC生成图像功能。值得一提的是,每种功能都有一张对应的NFC卡片,消费者用现场样机一碰就可以进入演示环节,省去了与店员沟通的过程。 但需要说明的是,无论OPPO还是vivo,相对于AI功能,处理器芯片、影像配置,仍然处于更明显的产品介绍位置,在店员的介绍中优先级也更高。 综合来看,仅就销售环节而言,小米、荣耀、华为,将自家大模型产品的功能展示给消费者的意愿不高,OPPO、vivo有一定针对性的布置,但也很难说现有的AI消除、生成图片就能完全代表大模型的实力。 此前OPPO首席产品官刘作虎曾表示「对于手机企业而言,再不布局大模型就没戏了」,但从2024年3月来看,所谓的布局可能也仅仅是布局,手机发布会上动辄几十亿参数的语言大模型,对于消费者而言依然是「雷声大雨点小」。 旧的回忆,新的故事 造成手机厂商在销售环节没有过多展示AI功能无非是这几个原因:一是本身AI功能不适合在线下这种场景展示,二是能够展示的效果不好,三则是这些功能不足以促成消费者达成购买。 钛媒体App为此查看了京东、淘宝、拼多多等主流电商平台各家手机厂商的主力产品,除了OPPO之外,在详情页的主要卖点中,AI功能有的不见踪影,有的只占据边角的位置。 如果说智能手机的线下消费相对需要更接地气的表达,那么线上电商平台也没有太多的AI功能宣传,应该可以看出一些厂商对于大模型功能的理解,或许就是所谓「锦上添花」。 大模型当然可以成为发布会上最亮丽的那朵花,但实际上买回去的衣服一定是更好材料(硬件配置)的锦缎织成的。 图片来源:AI生成 从智能手机的发展历程来看,有着不少熟悉的故事。像是曾经的独立音频芯片、动辄上亿的高像素摄像头、苹果带动的压感屏幕,都曾成为过行业追求的热点,成为红极一时的选项。随后因为种种原因,被手机厂商扫进历史的垃圾堆。 其背后原因,无非是相关产业的成熟,导致智能手机厂商可以用较低的成本去获得一个「亮点」,至于这是不是消费者的「痛点」?能否成为促成产品购买的「卖点」?都无关紧要,毕竟「摸着石头过河」也可以获得一定的关注。 在智能手机行业工作的孙敏告诉钛媒体App,对于智能手机用户而言,能够在智能手机里,不需要语言基础、技术手段、注册、学习,「即插即用」的大模型,本身就是产品对于用户的一种价值。 在如今的激烈竞争中,智能手机厂商很难「腾出手」像科大讯飞、百度那样去All in AI。如何打磨产品,让AI更好的为用户所用,也许才是更加现实的问题。(本文首发钛媒体App 作者/吴泓磊 编辑/钟毅,文中孙敏为化名)

    2024-03-15
    20.6K
  • 逍遥区块链:关于SATS的投资潜力

    以目前的市值排名看,ORDI和SATS算是BRC-20中当仁不让的龙头和龙二了。 对很多生态来说,我们主要对龙头代币进行一下评估就可以了,因为很多生态中的龙二和龙三基本都是抄袭龙头,所以龙二、龙三长线看很难超过龙头。 但对BRC-20生态来说,这个状况似乎有点特殊:因为在BRC-20生态中,龙头(我们暂时把ORDI算为龙头)和龙二(我们暂时把SATS视为龙二)在价值取向和特点上还是有较大区别的。公众号关注:博森科技小蝶。 前者是新技术的第一个落地实践,在很长时间内并没有太多的应用,只是去年才开始因为铭文技术的出现在应用方面有了突破。而后者则完全是以应用为导向,自打出生起其价值就完全靠应用场景来支撑。 ORDI基本上类似比特币,也是一个新技术的第一个落地实践,也是在应用场景上暂时没有找到赋能。 但SATS却似乎不太像以太坊,因为它的诞生最初似乎不是为了应用,恐怕纯粹就是个MEME,甚至可能是部署者突发奇想开的一个玩笑,但后来被Unisat团队创造性地进行了赋能,从而有了应用场景的支撑。 SATS这段戏剧性的经历使它既有了MEME的特点,同时又有了应用场景的赋能。 正是这种双重属性,使得SATS爆发出惊人的后劲,市值迎头赶上并且咬住了ORDI。 我认为这个状况大概率还会持续到牛市。公众号关注:博森逍遥区块链。 因此如果纯粹从潜力上来说,我觉得SATS的潜力和ORDI非常类似,几乎难分伯仲。在牛市峰值的时候,大概率ORDI的市值能达到多少,SATS的市值也能达到多少。 然而我觉得对大多数SATS的持有者来说,大家除了关心SATS的市值以外,恐怕更好奇另一个问题: SATS的市值能不能超过ORDI? 之所以大家会有这个问题,主要是因为SATS曾经一度在市值上超过了ORDI,尽管后来又跌了下来,但这个奇迹实在是让人振奋,给了持有者极大的想象空间。 在现在的比特币生态中,我们已经看到了实现反超的现成案例:SRC-20生态中反超为王的STAMP就是一个典型。 在SRC-20生态中,第一个代币是KEVIN,第二个代币是STAMP。 但由于STAMP在字面上更能表达比特币邮票(STAMPS)这个协议的内涵,因此它展现出了更强的MEME属性,从而在市值上反超了KEVIN,一跃成为龙头并持续至今。 那SATS有没可能重现STAMP的奇迹呢? 那就要看能给SATS赋能的要素能不能超过ORDI了。 在MEME属性上,SATS和ORDI都有足够的“意义”和“内涵”。SATS表示比特币的最小单位,ORDI表示铭文协议的缩写,这方面两者难分高下。 但在天时上,ORDI占了优势,它是第一个代币。因此,总的来说SATS在MEME属性上恐怕还是很难超过ORDI。 而在赋能方面,SATS不像以太坊那样有一个偶像特质极强的精神领袖带领,有长远的发展规划、有缜密的发展逻辑。 SATS的发展和赋能显得更为松散、更加随意。所以在赋能的持续性上存在一定的不确定性。 而这个不确定性就可能导致它无法持续被应用赋能,也就无法凭应用持续积累共识。 另外,还有一个更值得我们关注的指标:在萎靡的市况中哪个更抗跌。公众号关注:博森逍遥区块链。

    2024-09-27
    3.6K

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注