ChatGPT的本质是什么?是否将替代人类工作?我们人类又该如何与之共存?微软中国CTO韦青在本文利用工程师的底层视角,为大家揭开人工智能的冰山一角,探寻ChatGPT为何全球爆火。
我们需要通过ChatGPT理解什么?
GPT是现在最热门的话题,但GPT3模型两年前就培训出来了。GPT4的出现让人惊艳,但去年8月份它就已经被训练出来了。
什么意思?ChatGPT实际上是冰山一角。当我们看到某些现象出现的时候,某种意义来讲,这件事已经结束了。而这个时代才刚刚开始,ChatGPT现象会层出不穷。
再追逐冰山已经没什么意思了,我们要尽快通过浮起的冰山,去理解我们可能进入了一片冰山丛生的海洋。
从一个本质性的构成来讲,人类对世界的认知已经经历了三个阶段:农业时代是物质构成的。有地、有粮、有人就等于有权力,有生存的空间;工业时代如果你有能源、有动力,比有粮食还具备竞争力;到第三阶段,人类发现信息也是构成世界的一种本源性的存在。思想受什么影响?信息。
无论是麦克卢汉,还是鲍德里亚的理论,都已经强调了信息、电子信息的出现,可能会使人类社会的结构、边界、性质、方式都发生变化。
麦克卢汉最出名的理论是地球村。请想象一下,在父母辈的时代,朋友大部分是单位的同事,来自家族、村子、单位。仅仅过了几十年,现在你的朋友圈还受公司约束吗?
鲍德里亚的观点是,如果人类无止境地或者完全泛滥地利用数字化信息技术,我们很快就会进入一个比真还真的时代,那些由人工智能生成的照片、文字,你觉得它是真的吗?
鲍德里亚说的“比真还真”的时代,它已经来了。
语言是思想的边界,技术是思想的实现
当你埋头在屋子里面,研究最新技术进展,比如现在的最火的ChatGPT,出门一看,好像满世界的人都把它当成了很新鲜的事情。
ChatGPT3.0算是一个比较大的突破,但它两年前就有了。它的结构、基本原理也存在很多年了。
语言是思想的边界,这是维特根斯坦说的,但我要给他再加一句话,技术是思想的实现。
我们忽略了一点,能够把技术开发出来,先得有一个思想。ChatGPT,实际上它只是一种提取已经被沉淀、被记忆的知识的一种交互方式,底下什么?是基础模型。像谷歌的BERT,Facebook的LLaMa。
为什么GPT现在那么火?它背后是OpenAI的技术信仰,再加上微软的Satya(微软CEO)、Kevin Scott(微软CTO)这些人的技术信仰的结合。这些人都相信,靠大量的语料和海量的计算,能够产生出对于知识的沉淀和应用。
Sam Altman说,GPT走出的第一步,是拿把人类知识先沉淀下来。就像先把玫瑰花蒸馏成玫瑰精油。
但精油太浓了,你要使用的话,需要调和。所以第二步,就是用Instruct(指令)的方法,用提示词的方法,把精炼的玫瑰精油,滴到沐浴露中去。
但是,这件事没被证明可行之前,某种意义上是完全要靠信仰支撑的事情。有多少人敢这么做?又要花人力、花时间、花海量的金钱,结果可能竹篮打水一场空。某种意义上,它的成功也可以理解成幸存者偏差。
我认为你要赞叹的,不应该是ChatGPT的模型多么伟大,而是它背后耐得住寂寞、怀疑的这种定力、决心、信心,这已经是一种技术信仰了。
我们有没有对于工具、对于数字化技术的技术信仰?这才是我们应该问自己的。
认知达到信仰的层面,才能够选一条没有人走过的路。尽管今天还走不通,但你就认为这条路可以走,因为第一性原理告诉你,这样做是对的,只不过人类的技术还没有发展到那一步,还证明不出来。
另一个例子是SpaceX。它成功了,大家都觉得太牛了。但当马斯克后来接受媒体采访时,他哭了。他说当时我认为火箭可以回收,但NASA、所有大咖级人物、科学家都跟他讲,这条路是走不通的。
OpenAI是一样的,我们认为它在2023年1月忽然出名,怎么可能?它背后有太多的辛酸、坚持、疑惑、摇摆,只不过坚持下来了。
现在的机器并不具备真正的思想力
这一轮技术,大概率就是把我们的知识进行提炼。知识哪来的?是我们的所作所为、所写所说,落成的文字、视频、语音,经过数字化之后,被机器去提炼,建成一种模型,变成知识沉淀下来。
为什么大家觉得它很神奇呢?因为没有任何一个人有这种能力,能记住人类所有的知识。
有些人觉得,机器会涌现出一些思想能力。确实,它会表现成思想能力。但如果你知道它的算法是如何做出来的,你还是会形成自己的判断。
我要想先声明一下,每个人都会对这种现象产生不同的解读。我的解读是,现在的机器并不具备真正的思想力,是把人类知识记忆之后的一种使用能力。
机器是不会想的,想这个词是人类自己发明出来的。如果你硬把这种能力视为“想”,不能说错与对,但它会误导你对机器的判断、理解和定义。
做一个思想实验,这轮技术到底是什么?
如果我们发现了,可以通过蒸馏的方式,从植物中蒸馏出它的油性。请问,花园甲跟花园乙的拥有者,做同样的事情,最后的价值会是怎样的?他们做出来的东西,对社会的影响力会大不相同。
花园甲的拥有者,会怀疑提纯机器不行?还是会痛定思痛,发现原料有问题?
当我们从农业文明进入工业文明,已经受过很多降维打击了。当物质、能量变成信息的时候,会带来更加降维式的打击。
这种竞争方式,已经不是技术能力的竞争,有钱没钱的竞争……而是文明在一较高低。
你的文明所表现的形式,能否被新一代的会思考的机器学到、吸收到,并且让它的行为方式对你有利?
ChatGPT刚火的时候,知乎股价飞涨。在中国,具备语言语料的网站绝对不止知乎。为什么它涨得那么厉害?我没做过详细统计,但我认为,知乎的花园可能类似于花园乙。
我们再扪心自问下,贵公司、贵机构、贵组织,你们的知识的表现形式、呈现方式,更像是左边还是右边?你未来如何跟具备这样能力的公司竞争?
如果你的信息,无法沉淀成能被机器学习的知识。这一轮的机器能力,你能够利用到的概率就大为降低。