机器学习的环境问题

近年来,计算机科学与技术中,人工智能的机器学习方向十分火热。其实,正是由于机器学习的火热,机器学习的方法已经渗透到各个学科,所以下面的讨论对于用到了机器学习的学科同样适用。

机器学习中关键的一步,就是模型的训练。所谓训练,在此意义而言,就是对于给定的输入数据,计算出一组最优的参数,使得输入数据经过某一人工神经网络之后的输出数据,与期望的输出数据的差距最小。其中,这个人工神经网络由这组参数决定。这个过程,俗称“炼丹”。这是一个很形象的比喻,因为计算出最优的参数需要很大的计算量,自然也需要消耗大量的能源、释放大量的噪声(计算机散热器会产生噪声),而真的炼丹也是如此。能源的消耗,就意味着煤炭的燃烧,就意味着氮氧化物以及二氧化碳等有害气体或温室气体的排放。此外,机器学习需要机器,而生产机器的过程也是会排放大量的污染物的。以生产最核心的部件——处理器为例,生产处理器需要高纯度的硅,而硅的提纯就会排放大量的有毒有害气体。更严重的情况还有很多,比如在计算机运行过程中,由于散热系统故障,计算机产生的热量无法及时排出而积压在内部,最终导致机房起火、爆炸等事故,造成进一步的经济财产损失,更严重的,会造成环境污染问题。这也有一个俗称,叫做“炸炉”。由此可以看出,机器学习对于环境的危害确实不容忽视。

事实上,计算机科学家们已经提出了比较好的算法来计算最优的参数,然而,由于目前机器学习算法固有的问题,其需要大量的输入,想要减少计算量自然也是不可能的。

我认为,要想解决这个问题,只有提出更高级的算法。例如,可以设计一种算法,只需要少量的输入(可能意味着更少的计算),就可以成功的训练出一个相当好的模型。毕竟,人脑学习认知也不需要那么多的数据输入。

同时,目前“机器学习热”导致人们对于什么问题都想用机器学习的方法来解决,这是不正确的极其浪费能源等资源的行为。人们应当对于特定问题精心设计更优的算法,而不是一味的把大量的数据塞给计算机,让其进行计算。

(本文节选自我环境保护与可持续发展论文)

发表评论

注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

:wink: :twisted: :roll: :oops: :mrgreen: :lol: :idea: :evil: :cry: :arrow: :?: :-| :-x :-o :-P :-D :-? :) :( :!: 8-O 8)

本文链接:https://twd2.me/archives/9712QrCode