每周五上午10点,Web3行研会都会举行例行的线上分享,以专题的技术讨论和讲座、面向程序员为主。

在上周五举行的专题分享中,我们邀请到 Twitter资深机器学习专家钱亦磊老师、AIGC2099 联合发起人& Butterfly Partners 创始合伙人吉米2099老师,以及 Web3 GPT DAO 核心成员Elaine Qian,深入对话人工智能前沿专家,探讨未来AI模型和算法技术趋势,以及AIGC大时代创业模式。

我们特别整理了原稿,将18000字精简了近一半,以下是文字版干货。

主持人Elaine:大家好!今天我们将线上进行一场专家对话,关于AI模型和算法的技术趋势,以及AIGC大时代的创业模式。很高兴今天和硅谷Web3行研会一起,相约资深机器学习专家钱亦磊和AIGC2099联合发起人吉米2099。我们先请Twitter的Senior Staff Machine Learning Engineer,资深的AI机器学习专家,钱亦磊老师跟大家打个招呼。

钱亦磊:大家好!我叫钱亦磊,目前在Twitter工作,是Twitter的Newsfeed的技术负责人,我在Machine Learning的领域中也算做过一些小小的工作。在Twitter之前我是在Coursera工作时,也算做过一段时间教大家如何做Machine Learning。


主持人Elaine:接下来是吉米老师。吉米2099是AIGC2099的联合发起人,同时也是Butterfly Partners的创始合伙人。吉米老师跟大家自我介绍吧!


吉米2099:Hello,很开心和大家这里连线。吉米2099是我在AIGC2099智慧社区的数字身份,我也是AIGC2099的联合发起人。AIGC2099,是随着AIGC大时代到来,和生成式人工智能共同发展的开放式智慧社区。当我们最近谈AIGC这个话题时,我们往往谈的是内容生产力的工业革命和内容创作方式的文艺复兴。2099,代表一种关于科技的未来主义愿景,这个数字化符号象征着2023年往后的几十年里,人类社会数字化的演化历程和方向。近几个月,我们不断被人工智能生成的内容所震撼,这让我们深刻感受到了科技拐点的到来。根据科技史发展规律,科技仍会持续爆发。未来,科技将如何激发文化和艺术的创造力?科技又将如何平衡生命与自然的关系?这些问题需要我们深入思考和探索,不断诞生新的智慧。AIGC2099不仅关注技术趋势,也探索科技与人性在未来的共同演化和融合。在这个AIGC崛起的大时代,许多新事物的形态还没有完全被定义。我们AIGC2099智慧社区的形态,也同样暂时不用去定义。我们希望和有相同愿景的朋友们一起成长,一起贡献力量,在未来的时间里我们共同去定义它。


我的第二个身份,是Butterfly Partners蝴蝶创投的创始合伙人。我们是一个服务AIGC和Web3早期项目的投资孵化机构。


简单和大家聊一下Butterfly。在东西方的科学和文化语境里,蝴蝶都被视为一种神秘的生物。我们东方的哲学有“庄生晓梦迷蝴蝶”。庄子和蝴蝶的梦里梦外,属于同一个世界,融合了现实和虚拟的概念。这与当下物理宇宙与元宇宙混合现实的感觉有些相似。这也让我们联想到最近AIGC大爆发后,网络上出现大量以假乱真的AI生成文本和图片,让我们已经难辨真假。此外,西方科学中的混沌理论中也有蝴蝶效应的概念。蝴蝶挥一挥翅膀,微小的初始条件的变化以及轻微的扰动,可能引发一场世界性的风暴,甚至改变整个宇宙的演化结构和状态。回到Butterfly Partners的投资哲学,我们既关注虚实相生的AIGC内容互联网和元宇宙的未来,也同样注重看似微小偶然但实际上能改变未来世界的科技创新力量。


主持人Elaine:非常棒,我很喜欢您引用的"Butterfly Effect"这个典故。目前我们已经看到AI的奇点的到来,像微软这样的巨头都已经冲在最前面,各种细分领域的工具都开始有了AI的应用。AI工具的赋能让人类进入了一个全新的时代,但同时也带来了危机,例如挑战了目前大部分白领工作者的工作。今天,我们将与两位老师一起探讨AIGC领域人工智能从算法到模型的技术趋势,并分享一些可行的商业模式和创业方向。最后,我们还将聊聊每个人如何使用AI模型和工具,从而更好地适应AIGC的爆发。请钱老师先分享一下,作为资深机器学习专家,您对当前AI模型和算法的技术趋势有什么看法?


钱亦磊:首先,让我们回顾一下AI漫长的发展历程。如果大家还记得,从上世纪Alan Turing开始,图灵被认为是最早从研究人脑智慧,到研究机器智能,并开始推动AI发展的先驱。现在,图灵奖已成为计算机领域最高荣誉之一,基本上算是该领域的奥斯卡奖。从机器学习到人工智能,其实都早已是大家讨论非常久的话题。从早期的深蓝电脑在象棋比赛中战胜人类,到后来DeepMind使用AI在围棋中击败人类,我们已经看到AI的很多工作越做越好,人类在某些领域不断被AI超越。最近一段时间我们看到非常火热的AIGC,就是AI的一个大模型。AIGC可从字面意思上了解到,大型语言模型是一种生成式模型,它能够实现一些传统机器学习达不到的能力,比如内容生成。最近大火的ChatGPT就是一个自然语言类Chat型的Bot。然后最近非常火的还有Midjourney,可以用AI去生成图片。包括那个Stable Diffusion的Diffusion扩散算法也非常流行,人人都可以用AI画图。我们基本上可以看到一个非常清晰的趋势,AI模型正逐渐朝着大模型时代发展。从早期几千几万的参数,到现在百亿乃至万亿的量级,参数的提升导致我们看到了大模型相当卓越的效果。其次,我们现在的模型趋向于多模态,多模态是我们Machine Learning领域里一个比较专业的词汇。举个例子,人的身体有不同的感知,可以用眼睛看,也可以用耳朵听,大脑可以理解传统文字和图片的信息。而感知到的不同信息形式,就是不一样的模态。现在的GPT模型,基本上可以达到一个多模态的效果,可以实现新的功能类似同时识别图片和文字等多种信息作为输入。以后也可以和ChatGPT聊图片内容是什么,在真实世界里有什么意义。


主持人Elaine:明白。很多人都接触到了自然语言模型,Natural Language Model。以像ChatGPT一样的模型为例,我们可以直接输入英语或中文的日常对话来与AI沟通。能不能给我们介绍一下自然语言模型的技术和算法,以及它的特点?


钱亦磊:说到自然语言模型,我可以看到,ChatGPT中的T指的是Transformer模型,这和英文里的变形金刚是同一个词。自然语言模型大概是2017到2018年由Google的科学家发布。 这种模型相比较于传统模型,在处理一些并行化的工作时做得更好,而传统的模型很多时候要串行化。这是什么概念呢?可以理解为它能让训练模型的过程变得更加高效。这次是机器学习的一次显著提升,有一点像一个量变引起质变的过程。其实传统的机器学习的很多模型,也可以做类似NLP,也就是自然语言处理的工作。比如翻译、文字识别等,传统AI能在一定范围内胜任。而现在大家重新发现,大模型在这些传统AI能胜任的工作中也做得非常好。这是一个最新的发展大趋势。


主持人Elaine:吉米哥这边又有哪些观察和思考呢?


吉米2099:前阵子,我和钱亦磊老师也私下交流过,综合各方观点,我们达成了一个共识,模型将成为下一个时代最重要的基础服务。MaaS,Model-as-a-Service,是这个概念的核心。AIGC的四大要素——自然语言处理、数据、算法和算力,现在已经全部集齐。模型通过数据结构和算法的协同,在算力的驱动下,对自然世界进行模拟。模型本质上是人工智能的一个具体形态。参照互联网的发展史,我们可以看到,二十年前,家家户户的基础服务还是”水电煤“。再看现在,家家户户都有了”水电煤网“,网络已经成为最基础的服务。在可预见的未来,用我自己的话说,我们将家家户户都拥有”水电煤网模“,这里的模指的就是模型。


目前,最重要的模型就是GPT4,它是多模态处理模型的一种,是当下被大家广泛讨论的ChatGPT背后底层的大语言模型,Large Language Model。很多人可能还不知道什么是GPT,它的全称是Generative Pre-trained Transformer,实际上是一个被预先训练好的内容生成转换器,可以把自然语言内容转化成另外一类高质量内容。现在大部分人讲AIGC创业,实际上是在基于这个大语言模型,或者整合其他不同的开源模型做应用。在中国,不管是百度还是其他互联网大厂,都在努力追赶。即使我们数据和算法已经满足条件,并假设满足充足的算力供应,可能还大致需要两到三年时间才能追赶到当下GPT4模型类似的水平。


此外,目前最流行的AI图像生成模型是Midjourney,以及Stable Diffustion。很多人已经在广泛使用他们,进行文生图和图生图的设计和图像创作等等。


模型当然还会有自己其他存在的形式,就像十几年前移动互联网刚来的时候,大家突然从网页跳到了一群App。最近,又兴起了Chat或者Prompt模式。至于模型具体会发展一个什么样的形态,以及怎样和信息流和工作流整合,我们还需要拭目以待。


主持人Elaine:谢谢吉米老师,刚刚你提到,个性化的模型就是未来。当我们使用ChatGPT Plus的时候,作为付费用户可以获得更快的网速。小时候我们还是拨号上网,后来又出现了宽带和WIFI,很多基础设施都在不断完善。像Adobe这样的传统软件公司也已经开始应用AI。我个人非常看好未来AI模型会渗透到人类生活的方方面面中,不知道两位对于想在AIGC领域创业的朋友有什么建议?以及看好哪些商业模式?


钱亦磊:首先,我们都来想一想,什么是模型。以我最近的观察和思考,它非常像以前我们用的字典。有些人用的是体积小的字典,方便随身携带使用的,而另有些人就是拿着一本大英百科全书。在这里,不同类型的字典对于不同的模型来说,可以是一个非常形象的类比。以后不同的人,将会根据他自己不同的支付能力,来决定他选择使用什么样不同精度和强度的模型。我们再想一想,从这个角度来看,是不是以后卖字典这件事,本身就会是非常好的工作和商业模式呢?


拿我自己举例子,我是一个重度的电子产品爱好者,平时会关注到各种各样电子产品的评测,包括手机和TV等等等等。既然电子产品可以评测,那以后Youtube上应该也会有博主专门做模型的评测,我觉得这是非常有意思的,吉米怎么看这个趋势?


吉米2099:我也赞同,未来商业模式将更加关注个性化的需求,也就需要开发更多专用模型。这些模型将构成未来基础服务的基础设施,并可能引发新型模型市场的繁荣。模型可能以一种新的形式——语言交互界面——连接到我们的个人设备上,从而实现自然语言的人机交互,让人们能够直接使用模型而无需学习复杂的操作步骤。未来模型可能会呈现出各种不同的形态,就像十年前移动互联网引领了我们从网页跳到APP一样,未来也会有新的形态出现。


最近一个多月,我们在国内密集走访了来自香港、深圳、北京、上海、成都和南京等不同城市的AI领域创业者。其中包括传统AI应用团队,从传统AI转型到AIGC的团队,还有那些刚刚形成AIGC想法的团队。经过观察,我发现大语言模型方向,大模型开发可能并不是中小型创业者需要考虑的选项。目前大多数创业者都在做大模型Fine-Tuning的应用。很多团队正在利用Hugging Face和Github上的开源代码来整合自己的应用。实际上,目前大多数AI创业团队对于不同模型的价值以及不同模型能够实现什么功能,还是相对模糊的。他们共同的诉求是想知道什么样的模型在什么样的场景下适用,并且如何将其结合到自己的商业模式和业务场景中。因此,我认为这本身已经成为一个巨大的商业需求和极具潜力的创业方向。如果我们能够更高效、精准地分析出不同模型在不同场景下的价值,就能发展出类似现在亚马逊和美团点评这样基于评价体系的商业平台。这样的平台将可以为AI应用方提供更准确的模型方案。


未来世界也有可能变成一个类似大型网游的存在,免费用户使用免费的模型,而付费用户则可以使用更高效更智能的模型。模型作为下一代底层操作系统的最常见入口,在整合信息流和工作流方面,将会出现更多的创新和突破。


主持人Elaine:作为一个非技术互联网从业者人员,和从Web2到Web3服务的体验者,我也观察用户隐私问题一直是大型互联网公司比如各社交媒体平台的痛点。人工智能技术的是否可能通过提供更个性化的服务来解决这些问题?


钱亦磊:这个问题刚好和我现在做的一些事有些关系。在Twitter公司里,我正在解决一些关于数据隐私的问题,以更好地适应欧盟新数据法的要求。现在的新数据法对隐私非常强调,基本上,它会要求我们这些互联网服务提供商,以及使用模型的公司,必须向用户明确说明模型里的输入是什么样的形式。比如,以我们熟悉的Twitter为例,模型的输入可能包括用户的喜欢、转发、个人基本信息、以及与他人的公共回复信息等等。我们被要求很清楚地把这些模型的输入告诉用户。同样的,这次整个包括美国、欧洲和中国等地这些模型的法律跟进非常快。现在不管是ChatGPT也好,还是Midjourney也好,模型本身还是基于大量公共数据作为Training的基础。不过目前,我们与ChatGPT聊天的私人内容,被拿出来做训练数据的隐私数据还是相对较少的。未来,我们可能会探索更多的数据处理方式,例如,当使用公共数据训练大型模型时,我们是否应该进行本地化处理,或者在云端保护用户数据的隐私,以及调整一些小参数或模型配置等,以实现更个性化的数据服务。这些工作已经在快速推进中,当然在保护个人和商业隐私方面,还有很大的挑战。关于商业隐私方面,我们可以请吉米多交流一下。


吉米2099:在谈到隐私问题时,我们也尝试使用另一个词——数据安全。数据安全是政府到个人,以及商业机构,都特别关注的问题。目前ChatGPT主要部署在美国的服务器上,数据的处理和内容生成的操作也都在美国境内进行。不同国家的政府,比如最近新闻中意大利禁用ChatGPT的情况,都会从国家层面考虑整个社会的数据是否会流转到其他地区。因此,当美国以外的地区使用ChatGPT时会遇到阻碍时,就会出现有人中间进行桥接。例如,在中国,绝大多数人使用的AIGC工具是套壳软件。我们与软件交互时的数据,在流转中实际上都会被保存在难以验证的第三方,数据安全成为了一个非常大的隐患。对商业公司来说,当与做中间件集成的AI技术公司合作时,私有化的知识库往往也会被集成到对方的服务器上。他们不可避免地会担心敏感商业数据外泄的风险。


主持人Elaine:没错,当你不知道它的终端的处理会在哪里进行,数据最后会被哪里收集和作什么用途,意大利政府的行为也就可以理解了。另外,很多朋友也特别关注如何更好地使用AI模型和工具,使AI成为我们一个很好的辅助和补充,而不是代替我们。两位有什么见解?


钱亦磊:我建议大家如果有条件,一定要自己亲自去使用ChatGPT这些新的AIGC工具。就像90年代电脑刚刚出来时,大家要去学会如何使用Word、PPT和Excel。到了2010年左右的时候,大家要去学会如何使用智能手机和APP。今天,我们也应该主动拥抱这些新的AI工具,而不是把它们当成洪水猛兽,从现在开始,我们就要去思考如何用AI去优化现有的工作流和生产方式。相信很多朋友都听过,Twitter之前有过开源的动作。我自己在开源的工作中,其实也使用过ChatGPT去做一些代码的Summary,以及有些Comments完全是ChatGPT生成的。这些工作AI都做得特别好,替我大大提升了效率。那像我太太是做设计工作的,她现在就开始逐渐使用Midjourney做一些辅助工作。所以拥抱这些新的方法,对我们每一个人的生产效率都会是巨大的提升。


吉米2099:目前很多行业已经受到极大冲击,AI正在广泛替代传统的重复性工作,例如电商商品的文案和图片设计。再举例,我们曾经拜访过的一个传统医疗领域的公司,他们每天需要输出大量专业内容,比如需要分发几百篇原创医学类公众号文章,给到合作伙伴们。这对专业性和时效性都要求很高。传统的内容生成方式很重,公司需要联系和运营几百个医学相关专业大学生,每天制定标准布置任务,然后收集文档,按专业性原创性和分发要求进行审核和修改。管理工作的复杂度是巨大的。自从整合GPT之后,直接生成的效果特别好,内容团队一下子只需要以前十分之一不到的人力。这个降本增效的过程是显著的。因此,对于当下的创业者,甚至每个个人,以后都能以低成本的方式大量快速生成非常高质量的内容,这会带来深刻的变化。未来大部分的人员和行业都会被人工智能所影响或替代。所以,我们必须首先拥抱AIGC技术。


另外还有一些现象,比如AIGC技术在深层次的内容生成方面爆发后,AR、VR和元宇宙也将迎来重大突破。这些行业以前前最大的瓶颈是内容稀缺,而未来只要算力得到足够供应,元宇宙里的许多场景的内容,都能通过AIGC快速高效生成出来。对于Web3行业,AIGC也同样重要。我们仔细想一想,AIGC这个缩写里,最重要的概念其实不是AI,而是C,是Content,是内容。在互联网上,我们通过我们的感官感知到的所有时空环境下的信息场景,都是内容。内容赋予了我们互联网上的存在,是时间和注意力的一个容器。而Web3本身的基础核心又是Creator Economy,需要利用Blockchain技术建立信任机制,以及通过Tokenomics设计内容创作激励和分发机制。同时,在Web3的行业逻辑里,内容还有很强的社区属性,包括对内容长期叙事有更高要求。所以Web3社区也可以广泛应用AIGC工具,激活社区的内容创造力。


突然想到,不知道大家有没有怀疑过,今天我们对话的三个人,到底是不是我们真人本人?还是我们的数字分身?比如说我们这个头像是Midjourney画的?声音节奏风格是靠给定几分钟的声音输入,用微软声音复刻模型训练模拟的?对话的脚本是用ChatGPT写的?然后我们最后的对话是用文字转语音TTS技术,Text-to-Speech,实时生成的?接下来,可能只差捏一个3D版真人脸,帮我们去实现虚拟人分身了。


主持人Elaine:其实这也是虚拟和现实的一个结合。前两天我也在各种群里看到有很多人用Midjourney工具画画。比如穿着中式帽子挖煤的特朗普,然后还有就是在中国地铁喝咖啡的彼得蒂尔等等。AI在网络上搜集海量信息后,已经到达了出神入化的程度,今天在场的有许多创业者对AIGC领域也非常关心,两位老师们可以聊一聊,对于创业者来说,未来他们会面临哪些挑战,阻力或者风险?


钱亦磊:首先,千万不要去做一些只有大公司才有能力做的事情。这个应该算是个比较大的坑。除非你财力厚如Elon Musk马老板,不然就不要去自己想着再重新做一个新的ChatGPT吧?超大型模型的成本是非常高的。大家应该也有所耳闻,最近用来训练模型的A100芯片的供应是多么紧缺,如果你没有跟NVidia黄老板那边有很好的关系,你可能都拿不到必要的新硬件。也就是说,不要高估自己持续烧钱的能力。这么硬烧一个大语言模型出来,可能连马老板都不一定烧得起吧?具体需要多少,这个目前我也不知道,这件事我后面可以跟马老板交流一下。


主持人Elaine:也就是说,不要和大公司硬碰硬。大家要找到自己的细分领域,去拆分发现里面痛点或者问题,再整合投入到具体项目上,对吧?


钱亦磊:对。我们熟知的Midjourney,之前就只有11个人。然后我刚好认识第12个人,就是刚刚从我们组里过去的一位同事。这其实和以前在iOS上做开发和服务类似,大家可以像Midjourney一样,找到一个很细分的领域去做,也就是说,不需要去重新训练一个模型,而是使用现有模型做一些之前大家没想到的事情。相对于去训练模型,做Training,用现有模型做Serving,成本上其实是更低。当我们使用模型去应用到一些真实的工作场景时,相对自己Training而言,很多时候直接Serving的效果会更加实际明显。大家可以在成本可控的情况下,多做一些尝试。


吉米2099:完全同意。大模型开发远超出了中小创业者能力和财力范围。更多可以做的是关于大模型的Fine-Tuning,比如应用到某一个领域的知识库。或者将AIGC与具体的场景相结合,比如电商、医疗、教育、游戏和办公软件等。


我们再仔细想想,往前端一点看,每个人应该如何与AI交互呢?具体来说,其实是一种关于提问的能力,也就是如何用好人机交互的语言去生成内容。最近大家常会常提到的概念是Prompt提示词,以及Prompt Engineering,提示词工程。Prompt就是我们和AI进行人机交互的语言。当我打开Midjourney,我怎么能够让它生成一副更精准,或者是审美上更符合我的想象力和创造力的作品?那我就需要先去进行Prompt的构建。当我第一次用AIGC画图的时候,本质上也是在”抄作业“,先反向研究别人接近我想法和表达的作品的Prompt是怎么写的。有人可以用ChatGPT写出一篇非常浪漫的未来主义科幻小说,但也有人会抱怨ChatGPT为什么没有想象中那么好用。其实可能是Prompt不够精准。这也是人与AI一个相互训练的过程。如何使用更精准的Prompt,更好地进行人机交互,就是Prompt Engineering要解决的问题。现在大量的网络社区和创业项目都在做类似的事情。所以,中小创业者们都可以去想,以用户视角和体验出发,如何更好去帮助用户和AI进行交互。


主持人Elaine:明白。吉米哥刚刚说的这个Prompt Engineering,有点像我们训练自己家的小狗。对于AI也需要不断去训练它,通过给定指示性的细化任务,更好地Narrow down到自己想要的东西。结合前面钱亦磊老师讲的,既然模型可以集成为一本字典,那Prompt能不能也做成字典呢?Prompt字典可以是非常好的知识共享领域。而且基本上Prompt也都是我们人类自己的语言,不需要很强的编程基础。


钱亦磊:我可以再补充一点,不知道大家在使用ChatGPT或者其他AIGC工具的时候,有没有观察到,Prompt既可以是正的,也可以是负的,就像解数学公式题目一样。比如推特上,有喜欢也有举报的按钮。这个经验也可以应用在Prompt Engineering中,既给到模型Positive的指示,也能给到Negative的指示,从而达到和按钮类似的效果。比如使用AI画图工具时,我要画一只动物,但我不要画一只狗,这样就可以帮助AI更具体地理解你需要的场景。在计算机领域里,特别对于我们机器学习而言,大家都认知到正数和负数往往起到明显不同的效果。而就关于这一点,大众往往并没有很强的意识。建议大家可以去试一试。掌握这一点,可以帮助你更好去使用这些AI工具。


主持人Elaine:谢谢亦磊老师的补充。吉米哥刚刚提到了很多很棒的创意,我还想问问你,站在这个智慧社区创始人的角度,如何看待AIGC2099在整个AIGC行业里扮演的角色?


吉米2099:我们AIGC2099和许多新生事物一样,其形态还未被完全定义。我们的愿景不仅关注技术的发展趋势,也探索科技与人性如何在未来共同演化融合。我们也会在不断思考中实践我们的使命,运用智慧的力量去平衡AIGC这个新的科技魔法。同时,我们坚持”科技向善,以人为本“的价值观。希望有着相同愿景的朋友们,未来能够在这里一起贡献力量和共同成长。


回顾过去,人类的科技发展史并不总是乐观,并经常充满各种危机时刻。几天前,我出席了“最强大脑”水哥设计的自然主义空间的开幕活动。在现场,我也和他交流了一下关于人工智能和自然生命的未来。水哥的一个例子给了我启发。他说,当我们观看科幻电影时,经常会被末世废墟和技术灾难的场景震撼,而最后的镜头常常会回到一棵绿色参天大树。像阿凡达的故事就是发生在外星球,围绕一棵具有灵性的大树展开。这象征着我们要通过道法自然,拥抱自然主义才能取得最后人性的胜利。


主持人Elaine:非常棒!说到技术类社群,也欢迎大家了解一下我自己所在的Web3-GPT DAO,是一个由Web3的极客,工程师和创业者们共同建设的AIGC领域公开创投交流平台。欢迎对Web3和AIGC有兴趣的人才们一起来做一些有意思的产品和项目。


今天的分享会还有最后五分钟,欢迎大家提问。

观众Mikke:问个小问题。Stable Diffusion和Midjourney有什么区别?

钱亦磊:更好的理解是,Midjourney就是模型的一个应用,但它给大家做了一个社区,在这个社区上可以直接看到算法的各种使用过程,也可以看到很多大家画的图。而建立社区的工作是非常有价值的。同时,Midjourney是部署在Discord上。Discord本身也是一个大型网络社区。我认为这是他们最核心的不同。

观众Mikke:所以,给定相同的Prompt,我在自己电脑上搭建的模型和Midjourney能实现一样的效果吗?

钱亦磊:如果使用相同的模型,那实现的效果会是非常相似的。现在已经有非常多的模型开源了,可以跑在自己本地的主机上,如果有比较好的显卡的话,应该没有什么太大的问题。

观众Mikke:对,其实模型挺好搭的,建议大家都去试试。谢谢!

主持人Elaine:谢谢提问。想请二位老师最后再给我们几条建议,然后我们就准备收尾啦。先从吉米老师开始吧!

吉米2099:Okay,第一,我认为拥抱AIGC大时代的关键,并不是对知识量的要求,而是对人的提问能力和决策能力的考验。

第二,在AIGC迎来科技拐点之后,艺术和内容的创作方式发生了彻底改变。在未来,想象力和创造力是最重要的天花板。我联想到500年前,欧洲开始了以达芬奇为代表的文艺复兴时期。欧洲人刚刚从愚昧的中世纪走出来,重新汲取了古希腊、古罗马和世界各地的文明力量,才进入了全新的创造时代。往后才随之诞生了工业革命、牛顿万有引力、大革命民主自由思想的爆发等等。现在,我们又一下子进入全新的AIGC科技魔法大时代,每个一人都有可能成为新时代的达芬奇。

最后,我想用马来类比人与AI的共生状态。古代社会有会骑马的骑兵,和不会骑马的步兵,他们在战场上的战斗力显然是不同的。同样,未来社会也会分化为擅长AI交互的人,和不擅长AI的人。所以,从今天开始,我们就开始开始使用各种AI工具,最好是非套壳的模型和工具。比如,我们可以每天向ChatGPT提问十个问题,或者每天用Midjourney去表达想象中的画面感,这样我们就已经用实际行动加入到了AIGC大时代的浪潮中来。打不过,就加入,当下最重要的事,先用起来。

主持人Elaine:我喜欢这个“打不过就加入”的策略。非常有意思!

钱亦磊:刚好吉米也说了我想告诉大家一样的话,既然打不过AI,那就赶紧加入他们嘛。另外我还可以再补充的是,当我们在目前这个领域做深以后,也会看到一些AI的局限性和瓶颈。但我们不光要对AI有信心,更要对整个社会,对人类的发展有信心。2019年的时候,整个业内一开始对ChatGPT的定义是,花了很多冤枉钱,什么事情都没做出来。但当时间来到2023年,一切都发生了翻天覆地的变化。同时也希望大家,无论是自己创业也好,还是做好自己的工作也好,要相信自己选择的路。拥抱好时代,走自己的路,让别人去说吧!我们总会看到光明的未来,对吧?

主持人Elaine:对!总之就一句话:多用起来。随着新生事物的出现,既得利益者一开始都会持有相对负面的想法。不管是前面提到的文艺复兴,还是个人电脑时代刚到来时,都有很多人会先去否定。但在这场分享会上,我看到了很多乐观的东西。AIGC赋能我们去创作,去提升工作效率。包括前面吉米哥提到的观点非常棒,我们的想象力其实就是我们每个人可以达到的最远边界,不要让我们的认知限制了我们最终的潜力。今天非常高兴能和钱亦磊老师、吉米老师进行了一个多小时关于人工智能的思维碰撞。如果各位还感兴趣,也欢迎以后继续和我们交流。我们今天的对话就到此结束,感谢大家的时间,感谢硅谷Web3行研会的朋友们,也谢谢钱亦磊老师和吉米2099老师的分享!

钱亦磊 & 吉米2099:谢谢大家!再见!


Web3行研会分享合集/渠道:

  • Twitter:https://twitter.com/Web3BuidlGroup

  • B站:https://space.bilibili.com/1203944704

  • YouTube:https://www.youtube.com/channel/UCW1B_fh0FHf33T1HEtZEYOQ

关注我们: