adtop
首页 财经 查看内容

微软和英伟达推出迄今为止训练最大最强的语言模型MT-NLG

2021-10-12 08:40| 发布者: 余梓阳| 查看: 73358| 评论: 0|来自: 企业家在线  阅读量:14816   

摘要:语言模型简单来说就是一串单词的概率分布,它的主要功能是为长度为m的文本确定一个概率分布p,表示这个文本存在的可能性。你可能之前或多或少听过OpenAI最新的语言模型GPT-3,它被称为表面上最强的语言模型,也被视为革命性...

语言模型简单来说就是一串单词的概率分布,它的主要功能是为长度为m的文本确定一个概率分布p,表示这个文本存在的可能性。

你可能之前或多或少听过OpenAI最新的语言模型GPT-3,它被称为表面上最强的语言模型,也被视为革命性的人工智能模型。除此之外,还有一些重量级产品如BERT、Switch Transformer等,行业内其他企业也在尝试推出自己的车型。

微软和NVIDIA今天宣布了由DeepSpeed和威震天驱动的威震天-图灵自然语言生成模型,这是迄今为止训练出来的最大、最强大的解码语言模型。

IT之家了解到,作为图灵NLG 17B和威震天-LM的继承者,这个模型包含了5300亿个参数,MT-NLG的参数数量是GPT-3的3倍,是同类中现存最大的模型,在:等一系列广泛的自然语言任务中表现出无与伦比的准确性。

完整的预测。

阅读理解

常识推理

自然语言推理

词义消歧

基于105层转换器的MT-NLG在零样本、单样本和少样本的设置上改进了最先进的模型,并为两个模型的大规模语言模型设定了新的标准和质量。

据悉,模型训练是在基于NVIDIA DGX superpad的塞勒涅超级计算机上混合精度完成的,该超级计算机由560台DGX A100服务器支持,与HDR InfiniBand以完整的胖树配置连接。每台DGX A100都有8个NVIDIA a100 80gb tensorcore GPUs,它们通过NVLink和NVSwitch完全连接在一起。微软Azure NDv4云超级计算机采用了类似的参考架构。

更多信息请参考微软和NVIDIA官方说明:

微软

显卡

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享至:
| 收藏

相关

  • 国家药监局发文明确:明年起儿童化妆品禁止标注“可食用”
  • 商场、电商平台随处可见儿童口红、儿童眼影、儿童粉等广告。这些儿童化妆品在安全问题上给家长带来了困扰,也给监管部门带来了新的挑战。“与成人相比,儿童皮肤具有不同的生理特征,其结构、成分和功能与成人有很大不同。儿童皮肤细嫩,...
  • 企业家在线 发布于  2021-10-12 08:36  
  • 黄果峰隧道右洞顺利贯通
  • 百色新闻10月10日,田林至西林高速公路黄国峰隧道右线隧道顺利贯通,标志着天西高速公路建设取得阶段性胜利,为天西高速公路2022年底建成通车奠定了坚实基础。天高速公路黄国峰隧道位于西林县马帮镇马帮村西北约12公里处。隧道...
  • 企业家在线 发布于  2021-10-12 08:36  
  • 谷歌母公司权益价值3.2万亿美元,股价被低估42%
  • 简单地说,华尔街用两阶段增长模型分析了Alphabet的估值,发现它被低估了42%。Alphabet的最终价值是通过戈登增长模型计算的。假设年股息增长率等于10年期美国国债5年平均收益率的2%,贴现率为6.7%。Alph...
  • 企业家在线 发布于  2021-10-12 08:26  

企业家在线© 2012-   X3.4