吾看书

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

大白话解读:为啥说数据是ai的“粮食”?(第2页)

小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!

要是给语音助手的数据量不够,比如只给几千条,会怎么样?它可能只能听懂“标准普通话”,而且得是说话速度中等、声音大小适中的那种。要是遇到说话带口音的人,比如一个东北人说“帮我整个明天8点的闹钟呗”,它可能就听不懂“整个”是啥意思;遇到说话声音特别小的人,它可能连“定闹钟”这三个字都听不清,最后要么没反应,要么执行错指令,这就是数据量不够导致的“能力不足”。

这就像做饭的时候米放少了:要是一家人吃米饭,你只放了一碗米,煮出来的饭肯定不够吃;就算勉强够吃,水要是没放对,还可能煮出夹生饭,吃着又硬又难吃。AI的数据量不足,就跟煮夹生饭一样,不仅“能力不够”,还可能出错,没法应对真实生活里各种各样的情况。

再比如AI做“人脸识别”,现在很多小区进门、手机解锁都用人脸识别。要让AI准确认出每个人,也得有足够多的人脸数据。比如一个小区有1000个住户,AI不能只收集每个人一张正面照,还得收集他们侧脸、低头、戴眼镜、留胡子、扎马尾辫等不同样子的照片,每个住户可能得收集几十张,加起来就是几万张数据。要是只收集每个人一张正面照,那住户戴了帽子、换了发型,AI可能就认不出来了,这也是数据量不够的问题。

所以说,数据的“量”直接决定了AI的“能力边界”:数据越多,AI能覆盖的情况越广,应对复杂场景的能力越强;数据越少,AI的能力就越局限,只能处理最简单、最标准的情况。

四、数据的“相关性”更重要:不对味,再多也没用

除了“量”,数据还有一个更关键的要求——“相关性”,也就是数据得“对味”,得跟AI要做的任务有关系。要是给的 data跟任务没关系,就算数据量再大,AI也白学,根本做不好事情。

咱们还是拿“认猫”举例子:要是你想让AI学会识别猫咪,结果给它的全是狗狗、兔子、仓鼠的图片,就算给它1000万张,AI也不知道“猫”长啥样。因为这些数据跟“认猫”没关系,AI学的全是“狗有四条腿、会汪汪叫”“兔子有长耳朵、会蹦跳”,根本学不到猫的特征,最后肯定认不出猫。

这就像厨师想做红烧肉,结果手里只有青菜、面粉、西红柿,没有猪肉、酱油、糖这些关键食材,就算厨艺再高,也做不出红烧肉,顶多只能做个青菜面、西红柿炒蛋。食材不对,再努力也白费;数据不对,AI再先进也没用。

咱们再讲个真实的行业案例,更能说明问题。之前有个外卖平台,想让AI预测用户的“点餐偏好”,比如用户平时喜欢吃辣还是吃甜,喜欢吃米饭还是面条,这样就能给用户推荐他们可能爱吃的外卖,提高下单率。

一开始,平台犯了个错:他们没收集用户的“点餐相关数据”,反而收集了用户的“购物数据”,比如用户在电商平台买了啥衣服、啥化妆品、啥日用品。他们觉得“购物偏好能反映点餐偏好”,结果预测准确率特别低——比如用户买了很多裙子,AI就推荐清淡的沙拉,可用户其实爱吃重口味的火锅;用户买了男士剃须刀,AI就推荐啤酒、烧烤,可用户其实是个素食主义者。

后来平台改了,开始收集用户的“历史点餐记录”(比如过去一个月点了5次川菜、3次麻辣烫)、“浏览记录”(比如在平台上看了很多家汉堡店,虽然没下单)、“收藏记录”(比如收藏了好几家甜品店),这些都是跟“点餐”直接相关的数据。结果一改,AI的预测准确率立刻提升了40%——用户之前常点麻辣烫,AI就推荐同类型的冒菜、麻辣香锅;用户收藏了甜品店,AI就推荐那家店的新品蛋糕,用户下单率也跟着涨了。

这事儿就充分说明:数据的“相关性”比“量”更重要。就算数据量不大,但只要跟任务相关,AI也能学准;要是数据不相关,就算量再大,也是白费功夫。就像咱们学生考试,要是复习的时候只看跟考试无关的书,比如考数学,却看了一堆语文小说,就算看再多,数学也考不好;只有看数学课本、习题册,才能考出好成绩,AI也是这个道理。

五、现在的大模型:靠万亿级数据,才成了“通才”

咱们现在常听人说“AI大模型”,比如GPT-4、文心一言,这些大模型跟之前的AI不一样,它们像“通才”一样,能做很多事情——能写文章、能做PPT、能翻译外语、能帮人改代码,甚至还能跟人讨论哲学问题。为啥它们这么厉害?核心原因还是“数据”——它们背后有万亿级别的数据支撑。

热门小说推荐
兵人

兵人

一名被人类的野心制造出来的【人间兵器】,因为特殊原因在沉睡了一个纪元,在地球孕育出了新的物种,精灵,人类,半兽人,魔兽,矮人的新世界,他苏醒了。一条神奇的...

这个歌手有点浪

这个歌手有点浪

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!=================书名:这个歌手有点浪作者:衔玥文案曾经:关灯:身为流行音乐人气歌手,人称音乐才子。我愿意为你创作曲谱,你应该知足(¬_¬)齐欣:呵呵。后来:关灯:都说贵圈很乱,但是我很纯善,专心写歌苦干,老婆给我点赞o(* ̄3 ̄)o齐欣:呵呵。放浪不羁流行音乐歌星VS墨守成规昆曲艺术花...

圣徒子言传说

圣徒子言传说

圣徒子言传说情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,圣徒子言传说-海天银叔-小说旗免费提供圣徒子言传说最新清爽干净的文字章节在线阅读和TXT下载。...

我环游诸天万界

我环游诸天万界

我环游诸天万界情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的武侠修真小说,我环游诸天万界-拨开阴云见月明-小说旗免费提供我环游诸天万界最新清爽干净的文字章节在线阅读和TXT下载。...

漫漫昏宠

漫漫昏宠

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!=================书名:漫漫昏宠作者:空空如气文案宠文,和无良腹黑男的小日子。婚后某晚,池桑桑义正言辞的抗议道:“靳斯南,你满脑子怎么净是不正经的东西!”某人慢条斯理的应道:“这是喜欢一个人最直接也是最真实的表达。当然,可能在这方面我的表达能力略强于常人而已,你...

杀嫡

杀嫡

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有杀嫡作者:花羽容【文案】柳若兮以商女身份得皇帝赐婚侯府世子,全因父亲临终捐献全部身家;据说安国候府情况复杂纷乱,若兮说,对待敌人,认准目标,找准软肋,一击必杀!快狠准!决不能让咸鱼翻身!夫家有恶毒太婆婆,还有难缠狠辣的妯娌,外加找茬的姑姑,真是……!虽然家境差了点,这男人却...