今年3月底的某一天,在北京创业的王登科,突然有了一个强烈的想法——克隆自己。
他很早就想做一个聊天机器人。今年以来,ChatGPT的爆火,llama和chatglm6b等开源模型的出现,让他觉得,或许是时候了。
他决定试试看。
基于10万条微信聊天记录,280篇博客文章,他花了几个晚上的时间,在chatglm-6b预训练模型的基础上,训练出了自己的数字克隆人。而且,实现了像模像样的聊天。在第一次对话中,他的克隆人就学会了骂人。
王登科第一次和他的聊天机器人对话时,对方说了脏话
为了让AI更像自己,他又进行了多轮优化、训练,最终得到了一个相对理想的版本。现在,所有人都可以在一个网页上,跟他的数字版聊天。大部分时候,你几乎很难区分,屏幕的另一侧并非真人。
在王登科跟另一个“自己”瞎聊的同时,一些有野心的科技公司,正在紧锣密鼓开发自己的大模型,然后试图像流水线一样批量生产AI克隆人。
小冰公司启动了“GPT克隆人计划”,要克隆一批跟真人性格、技能、声音一样的明星红人;360创建了一个数字人广场,在发布会上邀请“马斯克”进行问答;国外的Forever Voices公司,为女网红Caryn Marjorie创建的克隆人同时跟1000个“男友”聊天,每分钟收费一美元;主打名人克隆聊天的Character.AI公司,APP上线一周下载量超过了ChatGPT。
这是一个潜在的大市场,已经被科技公司盯上。从野生网红,到娱乐明星,再到科技圈大佬,人人皆可被AI克隆,然后被售卖。
这或许是一条流量变现的新路子,是一个全新的商业模式,也可能是人类社交网络崩塌的开始。
连续创业者邱懿武,是浙大创业圈里的活跃分子。
两个月前,邱懿武用开源大模型,结合自己过去的交流和文章,做了一个“邱懿武GPT”。这是一个铜人形象的数字版分身,能模仿他的说话方式、语气、个性跟人聊天。
他想用自己十多年的经验和思考,去训练一个更懂自己的永生体,然后用它去提供咨询和交流。
这并非痴人说梦。“大模型技术到了拐点,现在GPT4的表现,已经超越了图灵测试,这意味着你已经区分不出来是人还是机器。”邱懿武对深AI说。
他迫切需要一个“分身”。自动去年启动“造物云”的创业项目后,他开始忙起来,很多时候感觉分身乏术。
他想开一门设计课程,传授一些审美知识和设计技巧。他还想开一门创业课,把自己多年积累的经验,总结的方法论,统一对外输出。
现在,他认为GPT可以帮他完成这项繁琐的工作。“让我的分身去全国各地开课,每天都可以讲,我自己都不用出镜。”他认为,以目前的技术,有些录播课程完全可以用GPT分身出镜,一些需要即时互动,甚至自己生成讲课内容的课程,可能还得等技术更成熟一些。
事实上,已经有人拥有了自己的数字版分身,并开始打工赚钱了。
润米咨询创始人刘润在抖音上有100多万粉丝,据他介绍,从去年10月开始,由人工智能公司硅基智能为他定制的数字人上线,后期他出镜口播的一些短视频,都是由这个数字人完成。他只需要提前准备好口播的文字稿,录好一段音频,数字人就可以出镜讲解,你很难区分真假。
刘润的口播短视频页面
通过这种方式,刘润的时间精力被解放了。
这背后的技术原理不复杂。人工智能让机器学习了刘润之前的视频,捕捉了他的神态、表情、动作,然后高像素模仿,生成跟真人出镜一样的视频。目前,做类似技术的公司很多,实现起来难度不大。甚至在二手交易平台闲鱼,你都可以找山寨商家定制一个自己的数字分身。
这只是初级版的数字分身。再往前进阶,是AI克隆人。AI克隆人是数字人中一个特别的类别。
美国的Forever Voices公司,从声音克隆切入市场。创始人John H. Meyer提及自己的创业初心时,讲过这样一段故事:六年前他的父亲离世,让他经历了人生中最艰难的时刻,直到今年4月,借助AI的力量,他用Forever Voices打造了一个聊天机器人,实现了跟父亲的再次语音交谈。
在对话框中,这个机器人有跟他父亲完全一样的声音、语气、说话方式。更重要的是,对方可以跟你实时互动,说的话不是提前录制,而是即时生成的。
“用AI的形式保存自己,让数百年后的几代人与你交谈。”John说。
就是在这个机器人的基础上,Forever Voices为女网红Caryn Marjorie打造了一个克隆人,粉丝可以花1美元/分钟,和AI版的她聊天。Caryn Marjorie在美国社交平台Snapchat上拥有近200万粉丝,它由此实现了同时跟1000个男粉丝聊天,并在一周内赚到了72000美元。
女网红Caryn Marjorie
这很大程度上得益于GhatGPT的诞生。GhatGPT能理解用户的意图,跟真人一样与你聊天。Forever Voices就接入了GPT-4的API。
之前,无论是声音克隆,还是形象仿真,都有一些局限。用AI声音合成复制任何人的声音,用深度伪造进行AI换脸,早已被骗子用来诈骗。但它们的使用场景有限,尤其是在实时互动上表现较差。
今年大火的生成式AI,让机器使用自然语言处理(NLP)来理解和响应用户的文本和语音消息,以更像人类的方式跟人类交流。并且,机器学习消化了被克隆对象的所有历史资料,还可以从与用户的交互中学习,并随着时间的推移改进其响应效果。
从录播模仿,到即时生成,AI打造的数字人越来越像真人,开始在更多场景里解放生产力。从交互体验的角度,机器学会了自我演绎,它不再是一个复读机,更像一个“有血有肉”的具体的“人”。
科技公司研发新技术,让AI克隆人变成现实,目的不是炫技,也不是要制造玩具。这或许,是一条流量变现的新路子。
Forever Voices公司为女网红Caryn Marjorie打造的AI聊天机器人,只是其明星克隆人计划的一部分。
这家公司瞄准大量公众人物,如乔布斯、马斯克、Taylor Swift等,建立他们的虚拟形象,让人们体验跟名人语音聊天的感觉。他们实现了让AI版本的乔布斯,与AI版本的马斯克对话。那段演示视频吸引了大量用户围观,让这家公司火速出圈。
用户如果想跟这些虚拟名人进一步聊天,需要按时长付费。这是一门几乎稳赚不赔的生意,因为克隆人一旦被AI创造出来,可以同时跟成千上万个人聊天,边际成本为零。它实现了将流量规模化、批量化、流水线式的变现。5月14日,女网红Caryn Marjorie在社交媒体宣布,他的“男友”数量超过了1万个。
在中国市场,小冰公司的探索更为激进。
小冰公司在5月16日宣布启动“GPT克隆人计划”,最短只要采集三分钟数据,即可为明星红人、专家学者或普通人创造源于本人性格、技能、声音、外貌的AI克隆人。
明星红人是其一大卖点。首批上线的AI克隆人中,关注度最高的一个,是此前争议很大的女网红“半藏森林”。
毫无疑问,网红能带来流量,用户为之付费的意愿也更高。根据小冰公司在6月1日公布的数据,后台报名克隆人的网红明星全网粉丝总数已超过5亿。粉丝疯狂涌入小冰公司开发的专属APP,刺激了下载和使用。
在流量变现上,小冰公司非常直接。
按照小冰公司的规则,任何人都可以在小冰的平台上创造克隆人。克隆的对象可以是你自己,也可以是其他人。你可以用公开数据克隆一个周杰伦,也可以克隆一个马斯克,然后跟他对话,还可以把它分享给其他人。
深AI和“周杰伦”的聊天记录
这其中最神奇的地方在于,你创造的克隆人在加V认证后,可以有偿对外“接单”。目前克隆人的“营业范围”,主要是陪伴式在线聊天。当有人付费后,小冰平台抽走一部分,剩下的都是你的。
对于有粉丝基数的明星而言,这简直是流量收割机。一个明星的精力再旺盛,工作室再庞大,也不可能做到即时回复粉丝私信,更别提长聊了。
克隆人能做到24小时在线,秒回消息,文字语音表情包灵活应用,关键是,它的知识储备、说话方式,几乎跟真人一样。
情感、社交和偶像崇拜,是现代生活中最重要的精神需求。从制造偶像到复制偶像,AI创造了一种新的商业模式。小冰公司CEO李笛说,“实际上这是种C2C(消费者对消费者)的商业模式,也是目前为止在AI大模型普及后,出现的第一个C2C的商业模式。”
抛开背后的道德和法律争议,这是一个看起来相当性感的商业模型。AI虚拟聊天和情感陪伴,一直以来就是一个潜力巨大的市场。如今生成式AI技术的成熟,给这门生意添了一把火。
在Forever Voices和小冰公司推出产品之前,去年底国内就有一款叫Glow的产品小火了一把。
Glow的玩法是在应用中创建虚拟AI机器人,用户可以创造属于自己的机器人,设定人物背景、性格、价值观等特征,实现实时沟通、互动并建立情感连接。通过后续的对话训练,还可以调整机器人的语气、说话方式等等。
这款产品上线后,只用4个月时间,积累了接近500万用户。其背后的人工智能创业公司MiniMax,现已估值超过10亿美金,晋升AI独角兽序列。
邱懿武认为,AI克隆人商业化是一个必然的趋势。“这本质上就是IP授权,属于虚拟经济的一种,把人也数字化了。”
通过克隆自己,人类实现了自己商业价值的延伸。“虽然我不是娱乐明星,但我把自己做设计的经验总结成方法论,服务不了太多人,那就让我的机器人去做好了。”他说。
他现在会有意识地把跟自己相关的数据记录下来,以作为将来克隆自己的养料,目的是要让自己的记忆留存在数字世界。
在《流浪地球2》中,刘德华饰演的图恒宇,运用深度学习和数字孪生技术,让自己逝去的女儿成为第一个拥有数字生命的人。数字生命就是将人的大脑中思维、记忆等所有数据,全部下载到计算机中,让人的灵魂能够在虚拟世界里永生。电影中,图恒宇借助丫丫的数字生命,在千钧一发之际拯救了地球的命运。
今年以来人工智能技术的突飞猛进,让越来越多人觉得,科幻电影中的情节,或许会在某一天在真实世界上演。
不过在王登科看来,现在所谓的AI克隆,更像是扮演,而不是真正意义上的克隆。
刘润数字人是真人写好脚本后,用一个模型生成声音,用另一个模型去让声音驱动虚拟形象,模拟人的口型和表情说话。
一些公司做的克隆人,是对文本大模型进行预训练,然后结合名人的公开数据,对名人进行扮演。AI对名人的扮演会更逼真,因为名人的数据更多。只要原本的底层模型足够好,扮演名人就非常容易。
王登科认为,这都不是他想要的克隆。AI只是根据人类输入的信息在做反馈,还不能自主地跟人一样去应对。
他想用大量本人产生的原始数据,从底层去训练、改变模型的结构和参数,使模型本身就具备跟自己一样的知识、性格、习惯、说话方式。这就像是在大模型上接入了一个有自己参数的插件。
但在试图克隆自己的过程中,他陷入了一种矛盾心态。
“我某种程度上挺讨厌AI克隆,它可能会消解人类存在的意义。提高效率是好事,效率提高到极致,就是不需要效率了,人也不需要创造了,那人存在的意义是什么?”他对深AI说。
这不是一个技术问题,而是社会伦理问题。
如果有一天,AI克隆人变成科技巨头的赚钱工具,变成普通人的商品和玩具,成为另类意义上的“电子宠物”,这对人类是更好还是更坏?
业界和监管层目前都没有答案。不过,小冰公司的AI克隆人上线不到一周,就全部变成了不可见状态,包括网红“半藏森林”也已下线。此前在年轻人中低调传播的Glow,也被限制下载。
AI克隆人还处在发展早期。对于人类而言,AI大模型就像一个黑盒子,人类还没有彻底搞清楚它是如何运作。“你扔进去一堆数据,一轮一轮跑,最后反馈出一个结果,但它到底训练了什么,改变了什么,为啥参数变化了,没人知道。”王登科说。
《大模型时代》作者龙志勇也对深AI说,大模型现阶段就是靠做黑箱实验来验证能力,靠做黑箱训练来提升能力。
永远保持敬畏之心,或许是我们迎接AI时代最好的方式。
巴比特园区开放合作啦!
中文推特:https://twitter.com/8BTC_OFFICIAL