零二读小说网

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

机器学习是“让机器从数据中长本事”的技术(第3页)

巧妇难为无米之炊,数据就是机器学习的“米”。

- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。

- 数据预处理:这步特别关键,就像淘米要去沙。包括:

- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。

- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。

- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。

2. 特征工程:给数据“化妆”,让模型看得更清楚

“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。

- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。

- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。

3. 模型训练:让机器“刷题涨本事”

选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。

- 训练过程中,得注意过拟合和欠拟合:

- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。

- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。

解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。

4. 模型评估:给机器“考试”打分

训练好的模型得测试一下准不准。常用的指标有:

- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。

热门小说推荐
嫁给一座荒芜城

嫁给一座荒芜城

《嫁给一座荒芜城》嫁给一座荒芜城目录全文阅读,主角是夏丰年小破城小说章节完整质量高,包含结局、番外。  《嫁给一座荒芜城》作者:铁头喵文案:末世来临,只有拥有自我意志的城市才能抵御鬼魅的侵袭。云琛被人算计落入鬼,侥幸逃入一座小破城,准备告别时却发现她成为该小破城的眷者,无法离开。为了自己的生活过得更好,她不得不开始种植食物,与鬼魅周旋,发展城市,开启荒城求生之路。小破城在她帮助下,找回了他过去的名字与...

雷凌擎天传说

雷凌擎天传说

描绘了一个波澜壮阔、诡谲多变的江湖世界。主人公雷凌身处江湖动荡之秋,影月教妄图开启“炼狱之门”,致使生灵涂炭,江湖大乱。为阻止这一灭世危机,雷凌毅然踏上征程,与凌飞扬、叶无痕等挚友并肩同行。他们的足迹遍布江湖,从繁华的武林重镇到神秘的极北冰原。在冰原,他们与冰原部落相遇,却意外卷入部落与影月教、玄冥阁的纷争。先是与......

我是无敌仙

我是无敌仙

夫灭道者,铸仙魂为虚,孕仙体成真,时光不加神魂觅不朽,轮回者,掌轮回印,轮回万世,铸真我法身为不灭…不灭者…......

我们同居的日子

我们同居的日子

因为一个渣女而改变一生,被骗钱,被骗感情,为了要报仇雪恨,不远万里来踏入不一样的世界,认识不同的人而改变自己的人生!......

废材弃婿竟是天帝

废材弃婿竟是天帝

天帝萧玄被逼自爆,却在生死间领悟混元经第九层。凭着一丝混元之力回到真武大陆,悔婚的未婚妻因修得自己当年随手创造武学从此成为家喻户晓的天才,将自己一道低级功法修至入门的凡人成了一方巨擘,将自己废弃丹方研习明悟的药痴成了药尊者……而自己亲哥哥所留的家族,却成了人人欺压的落寞家族。他双指一捏,誓要将这些忘恩负义之辈碾成齑......

一人持枪,万世名

一人持枪,万世名

这世间,有三千国、有修行界、有江湖,边塞亲王之子林渊,于修行界顶宗之一天师府学艺下山,以及冠之岁尊父命入京朝圣,接手妖国拐卖事件,卷入皇室之争,京中各色人物粉墨登场,皇帝、王侯、文官、女国师、道士、僧人、读书人、妖怪、巫师、萨满、胡人……仙侠王朝背景下、人、妖之争恢弘大故事徐徐展开。朝堂>修行界>江湖,皇室>所有势......