返回

国产神经网络

神经网络连子棋使用的是中国自主研发的神经网络———— 确定性神经网络 ,是目前为止为数不多的国产神经网络(框架)。

神经网络及深度学习技术发展至今,已经得到了越来越多的关注和应用,被泛称为人工智能(AI)。根据AI相关企业的聚焦点可将其大略分为三个层面:

  • (1)AI技术研发:主要从事AI基础理论研究、实现,产出一套AI算法或框架,譬如:“确定性神经网络”、卷积神经网络、图神经网络等。
  • (2)AI应用开发:主要使用开源的AI算法或框架,设置和修改训练参数,学习出相应的模型,应用于各自的领域,譬如:基于AI的自然语言处理、基于AI的视觉感知认知、基于AI的数据挖掘等。
  • (3)AI产品运营:主要工作是集成开源或商业版本的AI应用,生产出产品并进行运营,譬如:无人驾驶汽车、智能机器人、推荐系统、智能翻译系统等。
  • 目前中国的AI相关企业大多聚焦于第三层面,即通过集成开源或商业版本的AI算法生产终端产品并运营;少数企业聚焦于第二层面,通过使用开源的AI框架训练出不同领域的神经网络模型提供给第三类企业使用;而聚焦于第一层面的则少之又少。即便第三层面和第二层面的企业也会组织相应的团队或部门进行深入扩展,想消除发展瓶颈和知识产权限制,但由于难度大、周期长、难以快速见到收益,而不得不渐渐的将相应部门进行转型。

    然而,AI行业的知识产权大多集中于第一层面的AI技术研发方面,因而第二和第三层面的企业在发展中会受到诸多限制,从而存在必然的商业发展天花板;另外,由于基础算法非国产,在后期应用过程中发现问题会无法解决,只能等待开源算法本身的更新,这也导致AI产品会出现瓶颈,影响到最终的应用和体验。

    “确定性神经网络”便是在这样的环境下,由我国自主研发产生,从基本的卷积理论开始,推导并实现了一系列的相应理论,其除了完全的自主产权和理论体系之外,还有若干其他优势,例如:

  • 确定性神经网络的训练过程中不使用缩放对数据进行下采样,均在原始分辨率的数据上进行学习,这能保证数据少失真或不失真。
  • 确定性神经网络的训练和使用(预测)进一步解耦:以神经网络连子棋为例,在15x15的棋盘上训练的六连子模型,可以无修改的应用于11x11、19x19等棋盘上进行预测,不需要像绝大多数的现有神经网络一样统一大小,当然了,模型使用入口处不需要也不存在缩放、滑动窗等显性和隐性的操作。
  • 确定性神经网络的训练数据量无需太多,一条数据即可学习,随着数据的不断增多,其可以持续学习与进化,因而更适用于无法提前获取到全面数据的场景,也无需GPU硬件加速等大量的计算资源。