投递人 itwriter 发布于 2019-01-27 10:46 原文链接 [收藏] « »

  在《芯片巨头们 2019 年的 AI 芯片之争会如何?》一文中作者 Karl Freund 详细介绍了巨头公司们的 AI 芯片。此外,还有数十家硅谷创业公司和中国独角兽公司估值超过 10 亿美元,并且也参与了 AI 芯片的竞争。在本文中,作者将介绍全球的最杰出,或至少是最受关注的 AI 芯片创业公司。

  Wave Computing

  Wave Computing 在 2018 取得了不少进展,推出其第一个 DataFlow 处理单元,收购 MIPS,创建 MIPS Open,并将首批系统交付给少数客户。虽然 Wave 架构有一些非常有趣的功能,但我们更期待用户的大规模真实体验反馈。

  Wave 不是插入到服务器的加速器,它是用于图形计算的独立处理器。这种方法有利有弊。从积极的方面看,Wave 不会受到 GPU 等加速器面临的内存瓶颈影响。从消极方面来说,安装 Wave 设备将是新的升级,需要完全替换传统的 X86 服务器,也让其成为所有服务器制造商的竞争对手。

  我不认为 Wave 能从某个点击败 NVIDIA,但该架构的设计的非常好,该公司已经表示它很快就会有客户的反馈。 

图1:Wave 是从上面显示的 4 节点“DPU”构建的系统。Wave Computing
图1:Wave 是从上面显示的 4 节点“DPU”构建的系统。Wave Computing

  Graphcore

  Graphcore 是一家资金雄厚(融资 3.1 亿美元,目前估值为 17 亿美元)的英国独角兽创业公司,拥有全球化的团队。它正在构建一种新型的图形处理器架构,其内存与其逻辑单元位于同一芯片上,这应该能够实现更高的性能。该团队产品的发布时间暂不明确,不过他们去年四月表示“几乎准备好发布”了,12 月的最新信息表明它将很快开始生产。

  Graphcore 的投资者名单令人印象深刻,包括红杉资本、宝马、微软、博世和戴尔科技。

  我了解了该公司的架构,它非常令人印象深刻。从边缘设备扩展到用于数据中心的训练和推理的“Colossus”双芯片封装。在最近的 NeurIPS 活动中,Graphcore 展示了其 RackScale IPU Pod,它在一个 32 台服务器的机架中提供超过 16 petaflops 的算力。虽然该公司经常声称它将提供比同类最好 GPU 强 100 倍的性能。

  Graphcore 表示,4“Colossus”GC2(8 芯片)服务器可提供 500 TFlops(每秒数万亿次操作)的混合精度性能。单个 NVIDIA V100 可提供 125 TFlops,因此理论上 4 个 V100 就可提供与其相同的性能。

  与往常一样,细节更能发现差别,V100 峰值性能仅在重构代码执行 TensorCore 的 4x4 矩阵乘法时才可用,这是 Graphcore 架构巧妙避免的限制。更不用说 V100 消耗了 300 瓦的电能和大量现金这一事实。

  此外,Graphcore 支持片上互连和“处理器内存”(片上存储器)方法,可以得到超出 TFlops 基准所认可的优秀性能。在一些神经网络中,如 Generative Adversarial Networks,内存是瓶颈。

  再次强调,我们将不得不等待真实的用户用实际应用程序来评估此体系结构。尽管如此,Graphcore 的投资者名单、专家名单和台天价估值告诉我,这可能是一件好事。

图2:GraphCore 展示了 ImageNet 数据集处理的照片。 可视化可帮助开发人员了解其训练处理占用处理周期的位置。
图2:GraphCore 展示了 ImageNet 数据集处理的照片。 可视化可帮助开发人员了解其训练处理占用处理周期的位置。

  Habana Labs

  Habana Labs 是一家以色列创业公司,去年 9 月在第一次 AI 硬件峰会上宣布它已经准备好推出其首款用于推理的芯片,其创纪录的性能用于卷积神经网络图像处理。结果显示在 Resnet50 图像分类数据库中该处理器每秒分类 15,000 张图像,比 NVIDIA 的 T4 高出约 50%,功耗仅为 100 瓦。

  在 2018 年 12 月,Habana Labs 的最新一轮融资由英特尔风险投资(Intel Venture Capital)领投,WRV Capital,Bessemer Venture Partners 和 Battery Ventures 跟投,该公司的融资也由此前的 4500 万美元增加了 7500 万美元。

  据悉,Habana Labs 新的融资将部分用于流片其名为“Gaudi“的第二款芯片,该芯片将专注于训练市场,据称可扩展到 1000 多个处理器。

  其它创业公司

  我知道世界上有超过 40 家公司在为人工智能设计训练和推理芯片。我发现大多数公司都在进行简单的 FMA(浮点乘法累加)和混合精度数学(整型 8 位和浮点 16 位和 32 位)。对此我不会感到惊讶,因为这种方法相对容易实现并且会获得一些成果,但它不会为像 NVIDIA,英特尔以及少数初创公司做出不一样的架构提供持久的架构优势。

  以下是一些引起我注意的公司:

  Groq:前 Google 员工创立,从事 TPU 工作,他们有雄心统治世界其他地区。

  Tenstorrent:加拿大前 AMD 员工创立,目前仍处于保密阶段。我只能说其首席执行官的愿景和架构给我留下了深刻的印象。

  ThinCi:印度公司专注于边缘设备和自动驾驶汽车,与三星和 Denso 建立了合作伙伴关系。

  Cerebras:由前 SeaMicro(雷锋网(公众号:雷锋网)注,AMD 子公司,专注于超密集计算机服务器行,在 2015 年 4 月 16 日停止运营)员工领导,包括 Andrew Feldman,目前仍处于深度“隐身”模式。

  Mythic:一家采用独特方法进行边缘推理处理的创业公司,类似于非易失性存储器上的模拟处理; 应该在 2019 年有芯片。

  中国 AI 芯片初创公司

  中国一直试图找到一条摆脱美国半导体的方式,人工智能加速器可能会提供它一直在寻求的机会。中国设定了 2030 年要建立一个价值数万亿美元的人工智能产业的目标,自 2012 年以来,投资者已经向创业公司投入了超过 40 亿美元的资金。

  美国国会称这是一场人工智能军备竞赛,美国科技产业可能落后于中国公司和研究机构,因为其不太关注阻碍西方进步的隐私问题。

  Cambricon(寒武纪科技)和 SenseTime(商汤科技)可能是最值得关注的中国人工智能玩家,但像边缘 AI 这样的玩家更关注 Horizon Robotics(地平线)。此外,大型科技公司如百度、华为、腾讯和阿里巴巴也值得关注,所有这些公司都对人工智能软件和硬件进行了大量投资。

  寒武纪科技估值为 25 亿美元,是已经发布了第三代 AI 芯片的中国独角兽公司。寒武纪称它可以用更低的功耗提供比 NVIDIA V100 更好的 AI 性能,他们还销售其 AI IP,搭载在华为麒麟 970 和麒麟 980 的处理器当中,作为 AI 加速硬件。

  商汤科技也许是估值最高的 AI 创业公司,以在中国推广智能监控摄像头而闻名。这些安防摄像头数量超过 1.75 亿,包括其他公司生产的摄像头。商汤科技在香港成立,最近一轮融资数额达 6 亿美元,由阿里巴巴领投。据报道,这家初创公司的价值目前为 45 亿美元。

  商汤科技与阿里巴巴、高通、本田甚至 NVIDIA 等主要公司建立了战略合作伙伴关系。该公司今天拥有一台超级计算机,运行大约 8000 块(可能是 NVIDIA 提供?)GPU,并计划再建造 5 台超级计算机来处理数百万个摄像头采集的面部识别数据。

  雷锋网编译,via forbes

 
来自: 雷锋网
码云企业版,专注于助力企业开发 收藏 新浪微博 分享至微信

24小时阅读排行

    最新新闻

      相关新闻