加入收藏 | 设为首页 | 会员中心 | 我要投稿 开发网_开封站长网 (http://www.0378zz.com/)- 科技、AI行业应用、媒体智能、低代码、办公协同!
当前位置: 首页 > 大数据 > 正文

怎么让深度学习变得简单

发布时间:2022-07-07 14:26:05 所属栏目:大数据 来源:互联网
导读:在不远的过去,数据科学团队需要一些东西来有效地利用深度学习: 新颖的模型架构,很可能是内部设计的 这种进步的背后驱动力是迁移学习。 什么是迁移学习? 广义上讲,迁移学习是指在为特定任务训练的模型中积累知识,例如,识别照片中的花可以转移到另一个
   在不远的过去,数据科学团队需要一些东西来有效地利用深度学习:
 
  新颖的模型架构,很可能是内部设计的
 
 
  这种进步的背后驱动力是迁移学习。
 
  什么是迁移学习?
 
  广义上讲,迁移学习是指在为特定任务训练的模型中积累知识,例如,识别照片中的花可以转移到另一个模型中,以助于对不同的相关任务(如识别某人皮肤上的黑色素瘤)进行预测。
 
  注:如果想深入研究迁移学习,塞巴斯蒂安·鲁德(SebasTIan Ruder)已经写了一本很棒的入门书。
 
  迁移学习有多种方法,但有一种方法被广泛采用,那就是微调。
 
  在这种方法中,团队得到一个预训练的模型,并移除/重新训练模型的最后一层,以专注于一个新的、相关的任务。例如,AI Dungeon是一款开放世界的文本冒险游戏,因其人工智能生成的故事极具说服力,而迅速风靡:
 
  值得注意的是,AI Dungeon不是在谷歌的一个研究实验室里开发的,它是由一个工程师建造的项目。
 
  现在,通过迁移学习,这些瓶颈正在消除:
 
  一、小数据集不再是决定性因素
 
  深度学习通常需要大量的标记数据,在许多领域中,这些数据根本不存在。迁移学习可以解决这个问题。
 
  例如,哈佛医学院下属的一个研究小组最近部署了一个模型,该模型可以“根据胸片预测长期死亡率,包括非癌症死亡”。
 
  二、模型可以在几分钟内训练,而不是几天
 
  在海量数据上训练模型不仅是获取大型数据集的问题,也是资源和时间的问题。
 
  例如,当谷歌开发比较先进的图像分类模型excepTIon时,他们训练两个版本:一个是ImageNet数据集(1400万张图像),另一个是JFT数据集(3.5亿张图像)。
 
  在60 NVIDIAK80GPUs上进行各种优化的训练,运行一个ImageNet实验需要3天。JFT的实验花了一个多月的时间。
 
  然而,现在已经发布预先训练的XcepTIon模型,团队可以更快地微调自己的版本。
 
  例如,伊利诺伊大学和阿贡国家实验室的一个小组最近训练了一个模型,将星系的图像分为螺旋状或椭圆形:
 
  尽管只有35000个标记图像的数据集,他们能够在8分钟内使用NVIDIAGPUs对Xception进行微调。
 
  当在GPU上运行时,模型能够以每分钟超20000个星系的超人速度对星系分类,准确率达99.8%。
 
  三、你不再需要风险投资来训练模型
 
  当在60 GPUs上训练Xception模型需要数月的时间的时候,谷歌可能不太在乎成本。然而,对于任何没有谷歌规模预算的团队来说,模型训练的价格是一个真正令人担忧的问题。
 
  例如,当OpenAI第一次公布GPT-2的结果时,他们发布了模型架构,但由于担心误用,没有发布完整的预训练模型。
 
  作为回应,Brown的一个团队按照本文所述的架构和训练过程复制GPT-2,并调用模型OpenGPT-2。他们花了大约5万美元去训练,但表现不如GPT-2。
 
  如果一个模型的性能低于比较先进的水平,那么5万美元对于任何一个团队来说都是一个巨大的风险,因为他们在没有大量资金的情况下去构建真正的软件。
 
 
  在这个阶段,使用它来构建软件的工程师并不关心发送HTTP请求或连接到数据库,所有这些都被抽离出来的,工程师们只关注于构建他们的产品。
 
  换句话说,脸书构建React,谷歌构建Angular,而工程师使用它们来构建产品。随着迁移学习的发展,机器学习工程正朝着这一方向迈进。
 
  随着OpenAI、谷歌、脸书和其他科技巨头发布强大的开源模型,机器学习工程师的“工具”变得更加强大和稳定。
 
  机器学习工程师们不再花时间用PyTorch或TensorFlow从头开始构建模型,而是使用开源模型和迁移学习来构建产品,这意味着全新一代的机器学习驱动软件即将面世。
 
  现在,机器学习工程师只需要担心如何将这些模型投入生产。
 
  深度学习不再困难。
  

(编辑:开发网_开封站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读