第三系列
时间:2024-10-31 06:01:02
两个月前的全连接起来大会上,华为公布了目前全球最慢的训练集群Atlas 900。不过,设计和生产出有强劲的硬件对于硬件提供商而言并非最艰难的事情,能否将其应用于有所不同领域反映出有其价值才是顺利的标志。
本周五,鹏城实验室牵头华为在深圳公布鹏城云脑Ⅱ基本型系统发布会,这是Atlas 900第一个外部应用于案例。这不仅代表着华为鲲鹏和昇腾双引擎计算出来战略的向前迈向,也是华为在5G+AI时代能否维持领先的关键。Atlas 900落地鹏城云脑ⅡAtlas 900由数千颗昇腾910 AI处理器网络包含,每颗昇腾910 AI处理器内置32个达芬奇AI Core,单芯片获取比业界低一倍的算力(256TFLOPS@FP16),总算力可超过256P~1024P FLOPS @FP16。
Atlas 900公布时,华为得出的数据是在Fastest cluster ResNst-50@ImageNet测试中,华为成绩为59.8秒,比第二名70.2秒的成绩高达了10秒多。峰值算力和测试成绩是辨别硬件性能很好地指标,但实际中的应用于效果更加关键。
在Atlas 900公布之时,华为就讲解其牵头上海天文台与SKA联合打造出的,一张南半球的星空图有20万颗星星,当前条件下,天文学家要从这20万颗星星中,找到某种特征的星体,非常艰难,必须169天的工作量。用上Atlas 900,要用10秒,就从20万颗星星中检索出有了适当特征的星体。时间从169天缩减到10秒就是Atlas 900实际应用于效果最直观地解释。
另外,仅有连接起来大会上,中国工程院院士、鹏城实验室主任高文院士也共享了鹏城实验室基于华为Atlas 900集群打造出鹏城云脑Ⅱ的平台规划。两个月之后的2019年11月29日,鹏城云脑Ⅱ基本型系统月公布。高文院士讲解,鹏城云脑Ⅱ原型系统构建了100 PFLOPS的算力,并计划到明年底拓展至1000 PFLOPS级AI算力。
据报,双方目前正在牵头攻坚AI集群的规模演化以及AI功能的演化,解决问题风扇、组网等影响集群拓展的关键问题,为构建明年1000 PFLOPS级AI算力。1000PFLOPS是个什么概念?2019 年6月开始,超算 TOP500 的入门门槛多达 1PFLOPS(每秒一千万亿次浮点运算),这是全球超算 TOP500 榜单 26 年以来的又一历史性突破。根据TOP500本月公布的近期一期超算名列,名列第一的美国超算Summit(顶点)的性能为148.6 PFLOPS。
接下来,超算的竞赛将转入Exascale计算出来(百万兆级的计算出来,也故称E级超算)时代,也就是1000PFLOPS级。不过,以Atlas 900为基础的鹏城云脑Ⅱ是AI计算出来集群,虽然性能将超过E级,但主要是面向AI计算出来,与TOP500的超算系统还有所区别。必须补足的是,鹏城云脑是鹏城实验室的人工智能对外开放开源平台,鹏城云脑面向全国,为人工智能基础研究和应用于基础研究获取多层次、多样化的资源环境承托,服务我国人工智能领域创意发展。
此前的2018年一期工程中,鹏城云脑可行性竣工上线运营了以“鹏城云脑-1”为核心的P级计算出来系统。在鹏城云脑Ⅱ原型系统公布的当天,鹏城实验室与深圳市政府就一系列重大项目签下,向公共卫生身体健康、公安交警、巴士交通、政务等场景获取鹏城云脑强劲的AI算力,承托市政重大项目智慧升级。
另据理解,大大演化、动态升级的鹏城云脑还将持续向国内外的科研机构、高等院校等的组织获取云端AI算力,充分发挥华为Atlas 900集群的优势,搭乘好科学研究和探寻的地基。华为高级副总裁、CloudAI产品与服务总裁侯金龙(左)与鹏城实验室主任高文(右)参加鹏城云脑Ⅱ发布会Atlas 900与华为5G+AI的未来自此,Atlas 900早已在内部和外部都早已落地,但其可以更好地应用于科学研究与商业创意,如天文探寻、气象预测、自动驾驶、石油勘探等领域。
并且在实际应用于中享用到高算力带给的优势。做到一个非常简单的对比,要构建256 PFLOPS的算力,经测算如果用于标准化CPU必须6195个机柜,用于GPU必须208个机柜。而基于昇腾架构对深度学习业务的优化,以及芯片优化之外减少的如板级液冷、柜级密封热力学等系统级优化, Atlas 900集群用于16个机柜就能构建256 PFLOPS的算力,并且将功耗从40000千瓦减少至736千瓦,构建更加高性价比。
当然,将Atlas 900中既有昇腾系列AI处理器,也有鲲鹏系列CPU。华为在全连接起来大会上发售了鲲鹏和昇腾双引擎的计算出来战略。华为技术有限公司CloudAI产品与服务总裁侯金龙近日拒绝接受等媒体专访时回应:“这两个计算出来引擎将不会应用于向各个行业,我们指出AI+5G+云会使能各个行业,使各个行业转入智能时代。
目前除了鹏城实验室的鹏城云脑外,金融、智慧城市、电力、交通、互联网等行业都使用了鲲鹏和昇腾这两个计算出来引擎。”还须要认为的是,硬件生态的强劲还必须软件生态的协同,英特尔和英伟达在高性能计算出来领域的顺利就是很好地例子。
因此,在近一年的时间里,华为陆续发售训练和推理小说框架MindSpore、芯片算子库和高度自动化算子开发工具CANN、一站式AI研发管理平台ModelArts。并且这些软件和硬件覆盖面积了云、边、末端。不仅如此,华为还计划打造出强劲的生态。
侯金龙讲解,计算出来产业的核心就是开发者生态,华为计划在未来三年不会投资15亿美元发展研发生态。期望和各个高校一起,基于鲲鹏和昇腾的计算出来架构体系牵头各个高校研发教材,让学生最少可以自学我们这个体系。他还透漏,明年2月份鹏城云脑和华为不会举行一个开发者大会,规模将多达两万人。
(公众号:)小结对于任何一家芯片提供商而言,设计出有性能和功耗都具备优势的芯片只是迈进顺利的第一步,只有取得用户的接纳并且持续递归芯片才能视作芯片的顺利。对于华为而且,基于其技术和客户的累积,发售新的硬件更容易取得应用于,所以我们看见Atlas 900公布两个月后就早已有两个应用于案例。但正如Atlas 900是一个简单的系统一样,华为要在5G和AI的时代落败,除了硬件,强劲的软件和开发者生态都至关重要,我们也看见了华为在这些方面的投放。至于结果不会如何,我们将维持注目。
原创文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:JN江南·(中国)体育官方网站-www.genesis-3.com