绿茶通用站群绿茶通用站群

乔丹有多高

乔丹有多高 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器人ChatGPT火(huǒ)爆(bào)以(yǐ)来(lái),微软(ruǎn)公司创始人比尔·盖茨已多(duō)次公开谈论人工智能话题。在最近(jìn)的(de)一次(cì)采(cǎi)访中,他再次表(biǎo)示:“AI可能会让科技行(xíng)业迎(yíng)来一次剧(jù)烈的洗(xǐ)牌”。

这个结论是他(tā)在当地时(shí)间2月20日接受《In Good Company》节目专访时提出的。

他(tā)预(yù)期,AI的发展(zhǎn)可(kě)能会威胁(xié)到谷歌(gē)的市占率(lǜ),因为微(wēi)软在AI方面的行动(dòng)相当迅速。而(ér)最终科技巨头将把AI整(zhěng)合成用户的(de)“全能(néng)助手”,包揽一切应(yīng)用,与人们进(jìn)行沟通(tōng)并提供建议,可以取代亚马逊、Siri或Outlook等(děng)应用。

大佬口中全能助(zhù)手(shǒu)的到来可能尚需时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话(huà)题热(rè)点包围中杀(shā)出重(zhòng)围。

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑(hēi)料正能(néng)量

01

ControlNet颠(diān)覆AI绘画(huà)新玩(wán)法(fǎ)

AIGC向可控靠近

以AI绘画为代表的(de)AIGC上一次爆火(huǒ)的时候,还是2022年(nián)8月,在(zài)美国科罗拉多州举办的新兴数字艺术家竞赛中,一幅名为(wèi)《太空(kōng)歌剧院》的作(zuò)品获奖。

随后各大(dà)厂商的AI绘画软(ruǎn)件被广大网友熟知并体验,Stable Diffusion便是(shì)其中代(dài)表(biǎo)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能(néng)量

用户们可以在应用中输入一组关键词或者一张照(zhào)片(piàn),就(jiù)能(néng)获(huò)得一幅(fú)AI创作的画作。

作画(huà)的关键就(jiù)是(shì)所输(shū)入的(de)文(wén)本。同一(yī)组关键(jiàn)词也可以创(chuàng)作出很多(duō)张风(fēng)格不一样的画作,这让创作的过程就像(xiàng)开盲盒。

很(hěn)多用(yòng)户很喜欢这种不确(què)定的惊(jīng)喜(xǐ),他们会(huì)将(jiāng)生(shēng)成的美图当(dāng)做头像。而另一部分喜欢翻看AI绘画的“翻(fān)车”作(zuò)品。在社交媒体上,许多用户分(fēn)享AI“翻车现场(chǎng)”,例如(rú),一位网(wǎng)友的小狗(gǒu)照片被AI画(huà)成了“肌(jī)肉男”,还有网友的个(gè)人照片被AI识别成了建筑。

而如今随着ControlNet的出(chū)现与加持(chí),以往AI绘画的填写关键词(cí)游戏可(kě)能要(yào)被颠覆了。

ChatGPT之后又一(yī)应用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌科技行业(yè)?_黑(hēi)料正能量

ControlNet是(shì)一位正在斯(sī)坦(tǎn)福读博的中(zhōng)国(guó)人张吕敏(mǐn)创(chuàng)作(zuò)的一种基于控制点的图像变形算(suàn)法,主要用(yòng)于数字图(tú)像处(chù)理、计算机视觉和计(jì)算(suàn)机图形(xíng)学等领(lǐng)域。

其SD插件(jiàn)一(yī)经发布,在(zài)短短的两天(tiān)内便成为了AI绘画领域最新(xīn)的热(rè)点(diǎn)。

在此之前,大家用了很(hěn)多(duō)方(fāng)法想让AI生成(chéng)的结果尽可能的符合(hé)要求(qiú),但是都(dōu)不尽如(rú)人意,它的出现代表(biǎo)着AI生成开始进入真正(zhèng)的可(kě)控时期。

因为ControlNet可以直接(jiē)提取(qǔ)画面的构图,人物的(de)姿势(shì)和画面的深度信息等。有了它(tā)的帮(bāng)助,就不(bù)用(yòng)频繁的用提示词来碰运气,抽盲(máng)盒(hé)式的创作了。

通(tōng)俗的说(shuō)ControlNet相当于给(gěi)AI绘画加了“魔(mó)法”,不(bù)少博主(zhǔ)的(de)作品已经(jīng)获得了大量的浏(liú)览量,“viggo”就是其(qí)中之(zhī)一,他(tā)用朋友的照片(piàn)直接带她(tā)们走(zǒu)进动漫世界。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科(kē)技(jì)行业?_黑料正能量

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词;最(zuì)后用ControlNet插件(jiàn)绑(bǎng)定(dìng)骨骼开(kāi)始(shǐ)换关键词(cí)试效果(guǒ)。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正(zhèng)能(néng)量

通过图片就可以看出来(lái),效果十分惊艳。

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料正能量

ChatGPT之后又一应用杀疯了(le),AIGC或进(jìn)入(rù)可控期,将洗牌科技行(xíng)业(yè)?_黑料正(zhèng)能量

更厉害的(de)是,除了(le)真实的照片,草图也(yě)可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还能(néng)实现(xiàn)线(xiàn)稿(gǎo)转(zhuǎn)全(quán)彩图。大神张吕敏(mǐn)其本尊也亲自回应。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌科技行业?_黑料正能(néng)量(liàng)

不得不说当下AIGC已经(jīng)变得越来(lái)越强(qiáng)大,甚至(zhì)输出的作品都已(yǐ)经能以假(jiǎ)乱真了。

02

难辨(biàn)虚实,AIGC技术力爆发

警惕(tì)安全问题

近日(rì),“苏州金鸡湖有游艇party”的消息火(huǒ)遍(biàn)网络,而经过警方辟谣这所谓的“party”可能是(shì)全(quán)国第一起(qǐ)AI绘图诈骗(piàn)。

由(yóu)于这个活动里面(miàn)给出的美女(nǚ)照片都(dōu)是AI制(zhì)作的真(zhēn)人照片绘(huì)图,因为(wèi)太(tài)逼真,被大家当成真事(shì)传播了

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期(qī),将洗牌(pái)科技行业?_黑料(liào)正能量(liàng)

不过仔(zǎi)细观察(chá)可以发现,活动发起者提供的照(zhào)片(piàn)中有个很大的漏洞可以发(fā)现并(bìng)非真人,而是AI绘图,那便是图片中女性的手指部分(fēn)有(yǒu)的存(cún)在(zài)异常。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技行(xíng)业?_黑料正能量

有行业人(rén)事表示:“现(xiàn)在因为手指部分的(de)绘(huì)画算法比较复杂,AI还(hái)不太会画人的手,但最新看到(dào)的图(tú)片已经有越来越(yuè)完美(měi)的AI模型(xíng)出现,以后(hòu)可能就完(wán)全没有漏(lòu)洞了。

类似的AI作图诈(zhà)骗在国外也(yě)已有发生。据(jù)英国广播公(gōng)司报道,土(tǔ)耳其(qí)地(dì)震期(qī)间,有Tiktok用户(hù)使用AI合成了(le)儿童受灾的假(jiǎ)照片发布(bù)到网络,以此(cǐ)诱骗善良的人打赏(shǎng)“捐助”从而实施诈骗。

目前随着(zhe)技术发展,AIGC已经能做(zuò)出真(zhēn)人(rén)照片般(bān)的绘图效果,如果这样的图片被用(yòng)来诈骗,将非常可怕。

此(cǐ)外AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判者认为AI在“学(xué)习”了大量前人的作品之后,其创(chuàng)作没有任何情绪和(hé)灵(líng)魂(hún),难以和(hé)人类的艺(yì)术创作(zuò)相提(tí)并论。

另一方面,AIGC背后的版权、目(mù)前都并没有得到有(yǒu)效(xiào)的解决,还有AIGC会不会代替人(rén)类(lèi)“至高无上”的创意。

马斯克(kè)也(yě)强调,人工智能的安全(quán)问题需要得到重视(shì),太晚就来(lái)不及了。

03

AIGC下一站除(chú)了视(shì)频,还有(yǒu)远方(fāng)

技(jì)术(shù)都(dōu)是有两(liǎng)面性的(de),潜在的危害并不能(néng)掩(yǎn)盖其光辉的贡献。现在看来,人工智能技(jì)术将是第四(sì)次工业(yè)革命的核(hé)心驱动力(lì)量(liàng),将创造新(xīn)的增长(zhǎng)奇迹。

过去一年(nián),人工智能在技术和(hé)商业层面都有了巨大进展,AI绘画就是人(rén)工智(zhì)能技术发生方向(xiàng)性改变的一(yī)个代(dài)表。其(qí)下(xià)一站或许(xǔ)就(jiù)是视频(pín)。

此前,Meta和谷歌(gē)先后发(fā)布了几(jǐ)条引爆科(kē)技圈的短视频。这些视频引发(fā)关注并非内容做得(dé)多优秀,反而都非常简单,比如一匹正在喝水的马,一只(zhǐ)画画(huà)的玩具(jù)熊,或者一(yī)段骑摩托车的第一视(shì)角录像,随(suí)便一个有手机的人都可以随(suí)手录下一段(duàn)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)乔丹有多高ata-w="256">

但这(zhè)些(xiē)短视频的创作方式(shì)非常简单,创作者仅仅需要向AI输(shū)入一(yī)段话,甚至只是说一下(xià)要求,AI就(jiù)可(kě)以根据需要生(shēng)成一(yī)段(duàn)视频。

谷歌(gē)发布的(de)两个AI生成视(shì)频分别来自于(yú)Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公(gōng)布了AI生成的视频后(hòu),AI圈就已(yǐ)经(jīng)玩了一波(bō)梗,一(yī)个能够做出更高(gāo)清视频(pín)的AI还不(bù)足以在短时(shí)间(jiān)内戳(chuō)中兴(xīng)奋乔丹有多高(fèn)点。

Phenaki更(gèng)加(jiā)令人震惊的地方在于,它可以制作出超过(guò)2分钟的连贯的也有(yǒu)确切内容的(de)视频,这才是(shì)真(zhēn)正让(ràng)人们感到(dào)惊喜的(de)地(dì)方。因为无论AI生成的视(shì)频多么高清,也只能是为内容生(shēng)产者提供一(yī)个(gè)灵感,一个素材,一个过场动画。

不过能够制作出有具体剧情内容的视(shì)频就意味着,一些视频创(chuàng)作由AI代替人工完成(chéng)已(yǐ)经初步有了可(kě)能。

当下AI的发展速度已(yǐ)经(jīng)超(chāo)过(guò)大部分(fēn)人的想(xiǎng)象。内容(róng)产业的本(běn)质是(shì)供给创(chuàng)造(zào)需求(qiú),AIGC作(zuò)为全新(xīn)的内(nèi)容生产方式,可以为(wèi)内(nèi)容(róng)产业带来更新的内容风格、更快的(de)生产(chǎn)速(sù)度,更低的(de)生产成本(běn),这无疑会驱动内容(róng)产业的大(dà)爆(bào)发。

除了AI绘图、视频,AIGC技术还(hái)能(néng)应用于(yú)音乐、代码、机器人动作等(děng)多(duō)种内(nèi)容(róng)形(xíng)式的生(shēng)成(chéng)。不难(nán)发现该项技术(shù)不(bù)仅在游戏(xì)等行业能得到(dào)有(yǒu)效(xiào)应用,对(duì)于下一代互联网各(gè)种元素(sù)的构(gòu)建亦有关键意义。

从商业化的(de)角(jiǎo)度来看,文化娱乐、教(jiào)育、传媒等诸(zhū)多领域,本身就对(duì)基(jī)于(yú)AI的可视(shì)化内容有强烈(liè)需(xū)求(qiú)。

因此(cǐ),AI绘画及视频或不是结果(guǒ),而只是AI进程中的一(yī)块(kuài)重要拼(pīn)图,有望(wàng)在技术更新的(de)加持下实现更大(dà)的(de)应用价(jià)值。

AI从理(lǐ)解内容,走(zǒu)向了可以生成(chéng)内容,甚至能够创造出独立价值和独立视角的(de)内容。AIGC的再(zài)次出(chū)圈,更代表着未来的先(xiān)进生产力即将(jiāng)到来(lái)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能(néng)量

04

紧抓大(dà)模型与算力,牢固AIGC底座(zuò)

从(cóng)技(jì)术(shù)的发展也可(kě)以看出,在语(yǔ)言(yán)大(dà)模型(xíng)、图像(xiàng)大模(mó)型之后,多模态大模型已经成为了新(xīn)的(de)趋势。

大模型(xíng)被誉为当(dāng)前人工智能发(fā)展(zhǎn)的智能底(dǐ)座(zuò),是全球竞(jìng)争最(zuì)激烈的研究(jiū)方(fāng)向之一,包括谷歌、亚马逊、百度、阿里(lǐ)、腾(téng)讯等众多头部企(qǐ)业都在竞相发力。

不过训(xùn)练大模型的确价格不菲(fēi),以国盛证券发布的《ChatGPT需要多少算力》报告估算,GPT-3训练(liàn)一(yī)次的成本约为140万美元。而对于一些更(gèng)大(dà)的LLM(大型语(yǔ)言模型),训练成本则(zé)介于200万美元至(zhì)1200万(wàn)美元高价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立(lì)访(fǎng)客平均数(shù)1300万计算,其对应芯(xīn)片需求(qiú)为(wèi)3万多片英伟达(dá)A100 GPU,初始(shǐ)投入成本约(yuē)为8亿美(měi)元,每日仅电费就在5万(wàn)美元(yuán)左右。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗(xǐ)牌(pái)科技(jì)行业(yè)?_黑料正能量(liàng)

此外(wài)不论是(shì)ChatGPT还是AIGC,都离不开庞大(dà)算力(lì)支持(chí)。在关注各类大模型的发展同时,更应该(gāi)关注算力(lì)网络的建设。

算力网(wǎng)络(luò)正驱动AI产业发展进入史诗级加速进程,让AIGC及通用AI这一人工智能发展的终极目(mù)标离得更近。

因为算力可以对突破性技术创新(xīn)提供大(dà)力(lì)的支持。这方面,多模态大模型是典(diǎn)型。作为面(miàn)向(xiàng)未(wèi)来强(qiáng)人工智能(néng)、通(tōng)用人工智能的重要技术创新(xīn),多模(mó)态大模型已经在人(rén)工智能领(lǐng)域提出了(le)很多年,业界也有不少技术突破,但是,多模态大模型进一步往下走,算力需求呈几何式上升,一(yī)般(bān)的算力基(jī)础设施很快将难以胜任(rèn)。

从图像、文字(zì)、语(yǔ)音单独一(yī)项的训练,到双(shuāng)模态、三模态的跃迁,让人工智能可以(yǐ)灵活(huó)应对(duì)不同(tóng)模(mó)态的(de)转化(huà)、像人(rén)与世界交(jiāo)互一(yī)样自然,这方面,由(yóu)算力网络来(lái)驱动将有明(míng)显优(yōu)势。

ChatGPT之(zhī)后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能(néng)量

此(cǐ)外(wài),还有(yǒu)很多需要(yào)爆发式(shì)增长(zhǎng)的算力来支撑的技术创(chuàng)新,将在人(rén)工智能算力网络支撑下快速推进。

AIGC已(yǐ)经露出曙光,期待在大模型和大算(suàn)力的支持下AIGC能持续颠覆内容(róng)生产的方式,将创造的边(biān)际成本(běn)降(jiàng)低,让万众受益。

未经允许不得转载:绿茶通用站群 乔丹有多高

评论

5+2=