你的位置:火星电竞·(CHINA)官方网站 > 新闻资讯 > 火星电竞这也挡不住不雅众对此发出灵魂一问:"推不倒-火星电竞·(CHINA)官方网站
火星电竞这也挡不住不雅众对此发出灵魂一问:"推不倒-火星电竞·(CHINA)官方网站
发布日期:2024-09-23 06:06    点击次数:113

文|周鑫雨火星电竞

制图|况泽宇

拍摄|周鑫雨 邓咏仪

编著|苏建勋

2024 年 9 月 19 日开幕的阿里云云栖大会上,近 300 家涵盖算力、模子、诳骗的 AI 企业,和近 1000 种 AI 居品,组成了一幅全行业的活舆图。

多模态和具身智能,两个本年最热的 AI 风口,在云栖占据透顶的 C 位——

云栖大会"人工智能 + "馆。

走进汇注了近 60 家模子企业的"人工智能 + "馆,能昭着感受到,淌若不加点音视频接洽的多模态智力,光拼参数的大模子还是不够看了。

而具身智能,是"前沿诳骗馆"最" City "的存在。一进场馆,就能看到 20 多家机器人企业,携着或仿真人、或仿狗子的居品,给你来上一段取货、翻跟头、猛踹不倒的炫技扮演。

不外,不管是多模态,照旧具身智能,再魁岸上和前卫的科技,能在云栖引起围不雅的,只好"接地气"。

这届云栖,参不雅者中第一次出现了"义乌雇主团"。濒临同声传译、数字人主播和可一键生成商品图的诳骗,他们替用户建议了最为现实的问题:能帮我赚些许钱?

当红大模子独角兽月之暗面的展台,大约是"班味"最浓的一个。不少白领、IT 齐聚了过来,舌战字节的"豆包"和月暗的" Kimi ",哪个办公更好使。

在最具将来感的具身智能展台,被暴力踹踢而不倒的"小强"——逐际能源的双足机器人,引得不少路人围不雅。这款用于展示机器"小脑"研究遵循的机器人,目下还待在实验室里,供力学研究。

逐际能源双足机器人。

这也挡不住不雅众对此发出灵魂一问:

"推不倒,到底有啥用?"

多模态,模子的标配

通义千问:莫得不念念落地短视频的多模态诳骗

一进模子扎堆的"人工智能 + "体验馆,很难不被"通义大模子"展区的 AI 太极写照生成体验区诱骗。

通义 AI 太极写照。

体验者只须比划对应的姿势,在镜头中与简笔画合上——几十秒后,一张太极写照就出炉了。

天然,图生图的 AI 写照功能,仅仅阿里云模态疆域中的一小块。手脚人,阿里不仅发布了最新的视频生成模子,还搬来了文生图、图生视频、图 + 音频生视频的多模态全家桶。

全民舞王。

比如,在通义千问 App 内,阿里上线了 10 秒傍边的短视频生成诳骗"全民舞王"。

用户只需上传人或宠物的相片,以及一段言语音频,就能在 1-2 分钟内生成跳舞视频、对嘴唱歌视频,或者动态情态包。目下,这照旧个免费的功能。

人像动态视频生成技艺 EMO(Emote Portrait Alive)。

"全民舞王"的背后,是阿里巴巴智能研究研究地方 2024 年 2 月发布的人像动态视频生成技艺 EMO(Emote Portrait Alive)。仅需一张肖像照和一段音频,EMO 就能让人物按照音频施行张嘴唱歌、言语。

据现场使命人员先容,自 2024 年 4 月 25 日上线以来,"全民舞王"的使用人数还是冲破了 10w+。大批用户的使用模式是

"这太妥当 I 人作念短视频了吧!"有参不雅者惊叹。

"莫得不念念落地短视频的多模态诳骗!"

智谱:视频拍到哪,功课讲到哪

让家长纷繁立足的展台中,一定有智谱。

2024 年 8 月 29 日,智谱将"类 GPT-4o "的视频通话功能,搬上了我方的 C 端诳骗"智谱清言"。

这款交融了视频领悟、语音对话智力的功能,就好比 AI 瞬息有了五感。用户可以用智谱清言学穿搭、识别物品,也可以把它当成赛博闺蜜。

天然,更妥当中国人"活到老学到老"体质的玩法,就是 AI 教师。

对撰述业大开录像头,手机镜头拍到哪,智谱清言就能解答到哪。况兼,智谱清言的陶冶,质地以致和真人教师有的一拼,不仅循循善诱,还有问答互动。

比如陶冶"鸡兔同笼",智谱清言不会平直给出谜底,而是先疏导孩子列出二元一次方程组。

智谱清言视频通话功能。

孩子再也不怕费事,家长也目田了双手。

生数 Vidu:给我一张剧照,我还你一段新海诚

相通是"清华系"出生的生数科技,展出了自研的视频生成模子 Vidu。2024 年 4 月发布时,Vidu 因为性能优秀,还一度出圈,被称作"中国版 Sora "。

但即就是 OpenAI 的 Sora 本尊,也很难搞定视频的前后一致性问题。不难发现,大多 AI 视频中,每一帧的脸齐不一样。

为了搞定一致性费事,生数的搞定目的是,给 Vidu 找个"模特"。

2024 年 9 月 11 日生数科技发布的"主体参照"(Subject Consistency)功能,让 Vidu 字据给出的参考图,详情视频主体的形象和格调。

"主体参照"(Subject Consistency)功能。

现场,作家上传了一张新海诚电影《铃芽户缔》的女主角"铃芽"的剧照,Vidu 就字据铃芽的形象,生成了一段秋日公园视频。

VAST Tripo:3D 生成也有 Scaling Law

"咱们有宇宙最大的 3D 数据库。"

这是咱们在展区惟一听到过的带有"最"字的判断。这句话,来自 3D 生成界限的明星企业 VAST。

国内不少人可能会合计 VAST 面生,原因在于,这家由前 MiniMax 和商汤成员创立的公司,第一天就作念了出海的生意。

据使命人员先容,VAST 在外洋主打面向游戏、XR 开垦者的 C 端诳骗,在国内则主打 B 端诳骗,"况兼咱们在外洋贸易化可以"。

不少圈内人对 VAST 的 3D 生成模子 Tripo 的评价是:高性能,操作友好。字据输入的笔墨或者图片,Tripo 仅 8 秒就能生成 3D 原型图,况兼撑持市面上通盘的 3D 原型编著软件,还能平直 3D 打印。

Tripo 现场 3D 打印。

Tripo 笔墨生成 3D 素材。

当下,3D 生成模子的陶冶,也沿用堆参数的暴力好意思学 Scaling Law。2024 岁首,VAST 发布的 Tripo 1.0,参数就达到了数十亿,在陶冶数据稀缺的 3D 模子中是十分弘大的存在。

提高参数,相应的也要增多模子的陶冶数据。

使命人员深入,在获取稀缺的高质地 3D 数据过程中,团队花了不少时刻在"犄角旮旯"中获取数据。而在陶冶过程中,模子也用了不少 AI 合成 3D 数据。

就在 2024 年 9 月 19 日,VAST 还发布了生成质地更好的 Tripo 2.0,兑现 10 秒⽣成样式⼏何、10 秒⽣成纹理及 PBR(一种模拟光与材质互相作用的渲染技艺)。

音疯:AI 玩音乐照样疯

2024 年 7 月,网红秦新宇因整容失败发布的名为《还我妈生鼻》的魔性歌曲,瞬息冲上了微博热搜。

而这首歌的谱曲者,不是秦新宇,也不是专科音乐团队,而是一个上线不到两月的 AI 音乐生成平台"音疯"。

音疯 AI 音乐体验区。

音疯展台。

这款由昆仑万维推出的音乐制作平台,特色在:长。使命人员暗示,音乐生成的难点在于保持前后一致性,一朝歌曲越过 1 分钟,前后的曲风很难保持一致。

因此,音疯的卖点在于,将 AI 音乐生成的时长拉到了 4 分钟,况兼能够相对保持前后格调的一致性。用户只需要输入歌词,况兼在曲库和人声库中选拔心爱的格调,就能生成一段歌曲。

天然,使命人员告诉作家,目下音疯使用最高频的场景,亦然短视频:)。

HiDream.ai:为电议论身定制的 AI 生图

HiDream.ai(智象将来)的展台,立足了一批批的义务商家。

这家由前京东探索研究院副院长梅涛培植的 AIGC 公司,基因里就带着"电商"两个字。天然相通是图片生成,HiDream.ai 的 AIGC 创作平台"秩象",就像集背景、拍摄、后期于安祥的商品图使命室。

HiDream.ai 的 AIGC 创作平台"秩象"。

比如,商家只须输入商品图,就能活泼切换背景、模特。在为服装生成模特图的过程中,商家以致能够选拔模特姿势、性别、肤色、人种。

月之暗面:视频功能,Kimi 孕珠中

人工智能 + 馆人气最旺的展馆,有 Kimi 的一隅之地。

在一众把图片、音频、视频、3D 等模态玩出花的模子中,仍然主打文本、表格和代码任务的 Kimi 就稍显朴素。

天然,这并不影响 Kimi 展台的人气——或者准确来说,是"班味"。

现场不乏有上班族,平直向使命人员掂量笔墨转 excel、文献生成报表、文牍撰写的行径。以致还有企业 IT,平直来照应 Kimi API 若何接入钉钉、企微和飞书。

Kimi 展台。

不外,这款打工神器,也免不了朝着更多模态迭代。使命人员对作家深入,Kimi 的视频功能,还是在路上!

机器人炸场,凭空人扎堆

星河通用:浮松感拉满的机器人售货员

擅长"捏"的星河通用机器人 Galbot G1,此次走进了将来的无人商超。

消耗者在平板高下单后,Galbot G1 机器人就会前去货架,准确拿取下单的商品。

Galbot G1。

不外,这位机器人售货员的取货速率,有些太慢了——从下单到接到冰红茶,差未几用了 1 分钟。念念要进商超,机器人照旧得先戒掉这绝佳浮松感。

天然,无人售货仅仅星河通用展示的其中一个场景。目下,Galbot G1 还是能够精确捏取矿泉水、雨伞等无意甩掉的物品,还能够熟练开柜门、抽屉和晾穿戴。

使命人员暗示,2024 年 Q4,就有但愿看到机器人进入真正的贸易场景。

清宝:仿真机器人,上活水线搬砖

和披着人皮的机器厂友作念共事,随即就要成为现实了。

在清宝机器人的展台,几名不休变换 pose 的仿真机器人组成了门面——但是,由于眸子动弹过于活泼,但情态麻痹,这几名机器人照旧产生了一些恐怖谷效应。

清宝机器人。

而这几名仿真机器人的作用,既不是随同,也不是作念智能导游、机器人主播之类的"文职",而是平直进工场!

目下,由于活水线 SOP(圭臬操作经过)相比固定单一,且整机机器人老本较高,进入真正活水线使用的机器人,大多是单一的机械臂。

据使命人员先容,目下签单的整机人形机器人,在活水线上主要作念的是质检和零件分派,客户给出的原理也很别致:"念念让产线有点温度"。

天然,关于客户而言,机器人带来的和善,还得在降本增效上。使命人员对作家暗示,机器人一年可以爽朗 20% 傍边的人工老本。

酷开:云电视,收拢 AI 稻草

"这几年电视行业太难了!"云电视厂商酷开的职工,上来就倒了满满的苦水。随着电视机大盘被移动智能居品挤压,云电视厂商的日子也不好过。

不外,2024 年以来,酷开算是守得云开见月明—— AI 是他们收拢的稻草。

酷开在云电视上线的 AI OS,撑持语音搜索电视剧、电影,以及网罗照应,还能向 Chatbot 等智能助手一样,给用户保举片单。

比如用语音输入"陈谈明演天子的电视剧是什么?"酷开坐窝自大了搜索驱散:《庆余年 1、2》《楚汉听说》《康熙王朝》。

酷云云电视 AIOS。

值得一提的是,搜索驱散自大的演员相片、电视剧剧照,透顶是由 AI 在后台生成的。酷开使命人员告诉作家,这是为了能够精确贴合用户的搜索需求,"比如你的偶像是鹿晗,你念念看他的剧,信托也念念看到搜索驱散透顶是他的相片。"

不仅如斯,酷开也能字据用户的个人喜好,用 AI 生成片单保举视频。

上线 AI OS 一个月,酷开就吃到了 AI 带来的甜头。使命人员暗示,内嵌大模子智力后,使用语音交互功能的用户数目和时长有了昭着的晋升;与此同期,技艺老本的增多还能戒指在 10% 以内。

阿里云视频团队:一键给《甄嬛传》配英笔墨幕

一部熟悉的电视剧,就应该学会我方给我方配多语言字幕。

这个好意思好的愿景,还是被阿里云视频团队兑现了。

阿里云视频团队的视频字幕翻译功能。

以往给电视剧配外语字幕,是个大工程。你需要先把台词转录成中笔墨幕,再翻译成外语。与此同期,配字幕还免不了用裁剪用具。

如今,基于通义实验室自研的算法,用户还是可以兑现"端到端"翻译甄嬛传:不需要给字幕,平直扔视频文献,就能自动配英笔墨幕。

猎聘"多面 · doris ":将来,AI 给你发 offer

第一批数字生齿试官,还是上岗了。

猎聘旗下的 AI 居品"多面 · doris ",就是一位在 24 小时内,口试 400 多人的 AI 口试官。

目下,猎聘 AI 口试有设定问题、智能问答等多种模式。比如在智能问答样式,AI 领先会基于简历,分析出应聘者的潜在风险点,比如"无为跳槽""任职时刻不长",后续的口试,也大约率会围绕这些问题伸开。

猎聘 AI 口试居品"多面 · doris "。

不外,不少口试者反应,由于缺少即时交互,以及难以从 AI 口试官的扑克脸中得回反应,和 AI 口试反而更弥留了。

终末,使命人员贴心指示,数字生齿试官相比妥当一面、二面等人才的初筛样式。淌若企业念念要遴聘高端人才,照旧由人出马更显诚意!

Motiff 妙多:假想师救星,一句话也能生成 UI 了

目下国内最懂 UI 假想的大模子,源自一个叫作念 Motiff 妙多 A 的团队。

至少需要一周的 UI 假想,当今被简化成了输入一段话。

用户只需笔墨输入所需的界面类型、组成部分,以及定制化的态状,20 秒傍边,就能生成两版 UI 假想稿。

Motiff AI 生成 UI。

与此同期,基于自研的 UI 大模子对布局的领悟智力,原有 Cmd+V、Cmd+C 的类似动作,被 Motiff 简化成了一步到位的下拉动作。

狼人杀不尽,AI 吹又生

除了机器人和数字人,前沿诳骗馆最容易找到的,应该就是 AI 狼人杀。

游戏公司神仙网罗,就将 AI 狼人杀,手脚投放在抖音、B 站上的季节性用户行径。

这些 AI NPC 的"袭击性"还挺高,玩家发言一朝有逻辑过失,就会被"群起而攻之"。

神仙网罗 AI 狼人杀。

这些 24 小时无休、耐久在线的 AI NPC,将神仙季节性行径的用户时长,增多了 10 倍多。

在 2018 年上线的脚本杀 App "百变大阅览",近一个月也基于通义千问上线了 AI 脚本杀。

更进一步,玩家可以平直用语音和 AI NPC 进行对话。不外,对话的轮次有戒指,念念要增多对话次数,玩家只可氪金——这亦然目下不少 AI 脚本杀的主要贸易模式。

"百变大阅览" AI 脚本杀。

天然,在游戏前加了" AI "两字,并非全是功德。

使命人员告诉作家,接入大模子后,技艺老本就晋升了不少。与此同期,团队选拔脚本也更为严慎:太复杂的本,AI 不睬解;太浅显的本,用户不肯玩。

只可说,AI 在跨越,人也得随着跨越。

迎接交流!火星电竞



相关资讯