手机浏览器扫描二维码访问
这些数据从哪来?主要有三个渠道:
- 公开的网站:比如维基百科、百度百科、各种新闻网站、博客(只要是没加密、能公开看的文字,都会被收集);
- 书籍和论文:比如图书馆里的经典书籍、学术数据库里的论文(当然,会避开有版权的内容,或者跟版权方合作);
本小章还未完,请点击下一页继续阅读后面精彩内容!
- 对话数据:比如以前人们和其他AI聊天的记录、公开的论坛对话(比如 Reddit 上的帖子),用来教AI“怎么聊天”。
收集来的数据有多少?说出来你可能不信:训练GPT-3(ChatGPT的前一代)时,用了大概45TB的数据——相当于把10万部电影的文字内容,或者1000亿页小说,全部塞进AI的“大脑”里。
但这些数据不是“直接用”的,还得“洗菜”:比如去掉脏话、错误信息(比如“地球是平的”这种谣言)、重复内容(比如网上反复转载的同一篇文章),不然AI学了坏东西,就会“说胡话”。这一步很枯燥,但很重要——就像你买菜回来,得把烂叶子摘掉、把泥土洗干净,不然做出来的饭会难吃。
第二步:“做饭”——用超级电脑“炒”出AI模型
食材准备好,接下来就是“做饭”——这一步是OpenAI最核心的技术,也是最烧钱的地方。
这里的“锅”,就是“超级电脑”:OpenAI用的是微软Azure的云服务器,里面有上万颗“GPU芯片”(相当于电脑的“大脑”)。这些芯片同时工作,才能处理几十TB的数据——你可以理解成“用1000口锅同时炒菜”,速度快,但电费和硬件费也贵得吓人。
这里的“菜谱”,就是“算法”:简单说,就是告诉AI“怎么从数据里学知识”。比如,AI看到“猫”这个词,算法会让它记住“猫有四条腿、会喵喵叫、喜欢吃鱼”;看到“今天天气很好,我想去公园”这句话,算法会让它明白“‘天气好’是‘去公园’的原因”——相当于教AI“怎么理解文字的意思,怎么组织语言”。
这个“做饭”的过程,叫“训练模型”。训练一次GPT-3,大概要花几个星期,电费就得几千万美金;训练GPT-4,成本更高,有人估算得几亿美金——这也是为啥只有微软这样的大公司,才能撑得起OpenAI的研发。
而且“做饭”不是一次就能成功的:比如第一次训练出来的AI,可能会“答非所问”(你问“今天吃啥”,它答“地球是圆的”),这时候工程师就得调整“菜谱”(改算法),再重新“炒一次”(重新训练),有时候得反复几十次,才能让AI“说话正常”。
第三步:“试吃”——让人类教AI“怎么说话更得体”
饭做好了,得有人试吃,看看咸不咸、辣不辣;AI训练好了,也得有人“试聊”,教它“怎么说话更得体”——这一步叫“人类反馈强化学习(RLHF)”,说穿了就是“让人类当AI的老师”。
具体怎么做?OpenAI会找一群“标注员”(普通人也能做,只要通过考核),让他们跟AI聊天,然后给AI的回答打分:
- 如果AI回答得好(比如你问“怎么缓解焦虑”,AI说“可以试试深呼吸、听音乐,要是严重的话建议看医生”),就给高分;
- 如果AI回答得不好(比如你问“怎么缓解焦虑”,AI说“别焦虑,焦虑没用”),就给低分,还得告诉AI“为啥不好,应该怎么改”。
然后OpenAI会把这些“打分数据”再喂给AI,让AI学习“什么样的回答更受欢迎”——相当于你试吃后说“太咸了,下次少放盐”,厨师下次就会调整。
一位少年幸免于难与妖兽潮下,又因缘际会,踏入修仙宗门,开始了一段充满神秘与挑战的求道之旅。在这条通往长生的路上,他不仅要面对内心的困惑,还要应对外界的考验,且看他如何在修仙界的风云变幻中,凭借坚韧与智慧,踏出属于自己的长生之路?......
秋风北雁诀情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的武侠修真小说,秋风北雁诀-笑看斜阳-小说旗免费提供秋风北雁诀最新清爽干净的文字章节在线阅读和TXT下载。...
秦王府的小王爷元虚舟,被称作大岐王室灵根最强者,出生便被天道赐予“呼风印”,日后亦会成为落星神宫护卫大歧的神官长。作为哥哥的对照组,元汐桐一直以为自己是个没有灵根的废物。好消息是,她在十二岁那年终...
什么!穿越了?能看到人设?还能看到大纲?怕不是活在梦里?什么!还要战斗?目标是杀手之王?怕不是假酒喝多了?战斗什么的,这火传不了!作者什么的,给我见鬼去吧...
温莱是个完美的千金小姐。美丽,优雅,体贴,从不出错。她被誉为西捷之花,是第一王子的未婚妻,未来西捷的皇后。直到有一天,敌国皇储斯特莱尔抓走了她。这个像狮子一样闪闪发光的危险男人,当着西捷王子的面,将她强暴。备受侮辱的温莱没能得到未婚夫的怜惜与愧疚。在可怕的痛苦中,她窥知了这个世界的真相——原来她活在一本爱情书籍里,故事围绕一个可爱善良的灰姑娘展开,所有优秀的男人都会爱上女主角。其中,自然也包括温莱的未婚夫,未婚夫的弟弟,以及敌国未来最强大的国王斯特莱尔……温莱掰着手指头,数半天也没数完女主角的后宫。她看向马车里矜贵俊朗的未婚夫。这位未来男配,正用冷淡傲慢的腔调对她说:“就算你失去了贞洁,我依旧会娶你。我想,你应该没什么可伤心的。”温莱的确不觉得伤心。她只是决定,踹掉这个狗日的玩意儿,成为一个不守规矩的坏女人。注意:不是正儿八经的西幻文。设定随意,类似日轻。女主冷静,也可能变成个冷静的疯批美人。世界观有兽人,应该也有龙。看情况写吧,希望有人看。首-发:(woo18ui):...
壬寅年,我找你的第十一年。 ——迟铮 深情命不太好扛不住就拜拜了失忆受(千途)X死缠烂打拜拜了还要再追回来年下攻(迟铮) 现代灵异破镜重圆 感谢洗洗睡吧工作室提供校对支持...