Recognant创始人Brandon Wirtz:神经网络、人工智能根本就不复杂

我经常听人说他们运用AI技术取得了非常了不得的成就,但99%的成就其实都很傻。这篇文章看起来想在痛骂,但这并不是我的初衷,我的目的是找出AI领域如何在短时间涌现出了大量AI专家。同时,我还要揭露这些专家的所谓专业,其实是因为没人能指出他们做的都是垃圾。

如果你从头开始建造了一个神经网络,可以在手机上运行……

太棒了。你把一件T恤上都放得下的11行的Python代码转换成了Java或C或C++语言。看来交叉编译器三秒内能完成的事,你也能做到。

AAMABADGAAgAAQAAAAAAAA5JAAAAJDgzOWE4YWVhLTZhNDYtNGQxMy1hOWY5LWZmNGNkMWFiMjU0ZQ

许多人都没有意识到神经网络其实很简单。他们总觉得神经网络非常复杂。和分形类似,神经网络可以处理看上去很复杂的内容,但说它复杂是因为它需要重复以及一个随机参数生成器。

如果你建造了一个20层的深度神经网络……

恭喜你!你让上述代码不断循环,这听起来真是太难了,你居然还知道在什么位置加入“For”和冒号。

“深度学习”和N层深度都是一个可以自行输出的神经网络而已。由于它对循环进行循环,所以被称为递归神经网络(RNN)。

这和学车差不多,虽然它只会右转,但你还是可以到达任何地方。这可能不是最有效率的,但比让它左转要容易多了。

如果你在英伟达GPUs上训练了神经网络,并把它移到了手机上……

上面11行代码中的错误(或未实现)之处在于未设置种子。不设置种子就不能保证第二次能和第一次获得同样的随机参数,而结果也会差异巨大。由于手机和台式电脑无法给出相同的随机参数,不同的手机芯片会产生不同的随机参数,你在基于GPU系统上训练的神经网络很有可能无法在手机系统上运行。

相比在锁系统中分类,训练需要多花几百万甚至几十亿倍的时间,这样一来,建立一个手机的神经网络几乎是不可能的,因为不同设备之间永远存在差异。对于声音识别来说,正负5%只是轻微误差,但对于癌症检测或诊断来说,这就是巨大误差了。

如果你训练的神经网络可以完成人类尚无法做到的事情……比如从照片中来判断这个人是不是同性恋。

不,这是不可能的。神经网络是很蠢的黑箱系统。如果你使劲折磨它们,你可以对测试数据进行很好的拟合,但是从随机测试中无法获得很好的结果。AI就很善于识别伪相关,比如肯塔基州的结婚率与溺水率是无关的。

AAMABADGAAgAAQAAAAAAAA_8AAAAJGYxYjVhMmQ4LTdjOWMtNDk5My04ZTY1LTVlMmY3MWQ0OTQ0YQ

而且,照片拍摄的距离远近也不能证明照片里的动物就是猫而不是狮子。人们一直想神话AI,但大多数情况下,人类做不到的事情,AI也无能为力。有些时候例外,但仅限于透明AI。神经网络则不同,即使在人类可以复制最终结果的透明系统中它也不是透明的。

如果你使用TensorFlow来……

还记得上面那11行代码吗?TensorFlow只是那些代码的包装。TensorFlow擅长的是帮你把那11行代码内容视觉化。它在很多方面类似于谷歌分析(Google Analytics)。要完成谷歌分析工作的数据都在服务器日志里,但看懂那些日志很困难,但看懂谷歌分析却易如反掌。不过,谷歌分析会告诉你服务器变慢了,但不会告诉你原因。

AAMABADGAAgAAQAAAAAAAA8HAAAAJDQ1NzBhZWE3LTdiODktNDRjMC1iNTZjLWU1ZWM3ZmI4ZmMzYQ

我们这些理解神经网络的人不需要TensorFlow,因为我们不依赖那些花哨的图表或动画来把数据视觉化,我们看着原始数据和代码就能找出服务器变慢的原因。

如果你用神经网络进行自然语言处理(NLP)和自然语言理解(NLU)……

朋友们这是常识啊。神经网络模拟智能水平其实就和鼻涕虫差不多。让鼻涕虫学习英语的成功率能有多少?如果你的神经网络中英语中每个单词都有1个trait,那你的网络需要所有谷歌计算能力的叠加。如果每个词语还要一个trait的话,那你需要地球上所有云服务计算能力的总和。

AI可用来完成伟大的目标,但神经网络也是有极限的。

如果你的神经网络是自定义的

恭喜你,你知道如何把11行的神经网络代码压缩成9行遗传算法代码,或44行分布式演化算法。快准备一份新闻稿吧,因为你的55行代码马上就要……噢,稍等……

如果你的神经网络……无所不能。

恭喜你,你就是传说中的数据牧人。这听起来真是太了不得了,虽然你的神经网络和鼻涕虫差不多,不同的是,你可以生产很多鼻涕虫。拥有一套训练集没啥稀奇的。虽然很难跟踪,但请相信(或让别人相信)你只是个了不起的鼻涕虫训练师。

如果你把神经网络和区块链结合了……

恭喜你,你知道怎么建立“网红堆”。可惜的是,挖矿和神经网络毫无共同点,想通过区块链农场的所有节点来运行所有的数据集是不可能的。如果你通过正常大小的数据集把负载”切”成16 个方向,神经网络会出现问题。如果你有几十亿的记录,或你使用反向传播(Back Propagation)测试多级数据显示,你可能需要更大的规模,但这些技术无法把规模增加到1000s或几百万个节点。

我不太使用神经网络。

我的工具箱里有神经网络代码,但这很正常。它是可选择的工具,而不是整个产品的基础。我的大多数工作在认识学上叫做自定义启发法。与技术结合后又称为思维模拟。神经网络是按照大脑硬件模拟建模的软件(而神经网络并不是软件),思维模拟则可以模拟大脑的软件,就和大脑仿真器一样。思维模拟的历史只有10年左右,而神经网络已经存在50多年了。思维模拟的不同之处还在于它是透明的,能处理几百万行代码,而不是几十行。

更多精彩内容,关注青亭网微信号(ID:qingtinwang),或者来微博@青亭网与我们互动!转载请注明版权和原文链接!
责任编辑:子夜梦的死寂
分享到QQ 分享到微信
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册