壹象网

微信扫一扫

微信小程序
天下好货一手掌握

扫一扫关注

扫一扫微信关注
天下好货一手掌握

人工智能发现:措辞适当 议案更易被美国国会采纳

   2017-06-23 1560
核心提示:未来,美国的国会议员们写了一个议案,没准还会先让人工智能算法打个分。一家美国人工智能公司Skopos近日在《PLOS ONE》期刊上发
         未来,美国的国会议员们写了一个议案,没准还会先让人工智能算法打个分。一家美国人工智能公司Skopos近日在《PLOS ONE》期刊上发表论文:输入一份议案原文,外加几个变量,人工智能就能给出该议案通过立法的概率。

根据流程规定,一份议案首先要通过参议院或众议院某个委员会的审议,经该院投票通过,再由两院投票表决。此前,有些研究者也尝试过用算法预测议案在委员会、或在两院之一通过的概率,效果参差不齐。Skopos的联合创始人John Nay目标不限于此:他想要得出一份国会议案通过两院表决、成为法律的概率。

那些想要废除奥巴马医改的议案,算法打了多少分?

Nay收集了从第103届国会到第113届国会(也就是1993年至2015年)的所有立法数据,包括所有议案的全文和其他一些因素,比如共同发起者的人数、议案发起的月份、提起者是否为该院多数党成员等。

Nay使用从第103届国会到第106届国会的数据进行机器学习。所谓机器学习,就是给算法输入大量数据,并给定这些输入值相匹配的输出值,由算法自己“摸索”出输入值和输出值之间隐藏关联的特征。他用经过训练的算法对第107届国会的案例进行了预测。

下一步,Nay又进一步用第103届到第107届国会的数据训练算法,用于预测第108届国会的案例,以此类推。

Nay最终得到的完整版算法包含以下几个部分。首先,算法需要对议案的语言进行分析。通过词汇与周围词汇的嵌入方式,算法得以解读这些词汇的含义。比如,得到“获得教育贷款”这个短语,算法会假定“贷款”这个词和“获得”、“教育”都是相关的,把所有词汇相互之间的关联以量化的形式归纳,由此,每一个词汇就可以用一串数字来代表。结合这些数字,算法就可以理解每个句子的意思。

其次,一个算法试图找到它理解的句子“意思”和议案成功率之间的联系,另三个算法寻找上下文和议案成功率之间的联系。

最后,一个伞形算法综合上述四个算法的结果,预测议案的成功率。

仅仅预测一个议案能否成功没什么价值。大约有96%的议案会失败,也就是说,你每次都猜议案都不通过,也错不到哪里去。因此,更重要的是预测到一个精确的概率值。毕竟,一个国会议案往往会涉及很大的利益,在这种情况下,把议案的成功率上升几个百分点,也是意义重大的。

Nay在论文中提到,他的算法在评估成功率时的表现,比仅仅评估议案能否成功要好上65%。

在国会的案头,想要废除奥巴马医改的议案曾一度堆积如山。这些议案在算法那里拿了多少分呢?虽然,按照平均估计,它们的成功率也只有4%,但算法无情地给所有这些议案打出了更低的概率。

措辞很重要

那么,算法在评估议案成功率时,最重视哪些因素呢?Nay意外地发现,其实议案的文本本身就起到很大的影响。议案发起人属于多数党,以及议案发起人历任多届国会议员固然是个加分项,但对议案成功率的影响不到1%。

而就文本而言,“影响”、“后果”这样的词汇能提升与气候相关的法案的成功率,而“全球”、“变暖”这些词汇只会起到反作用。在与医疗相关的议案中,“公共医疗补助”、“再保险”这样的词并不讨两院议员的欢心。在与专利相关的议案中,看起来众议院讨厌“软件”这个词,而参议院讨厌“计算”这个词。

Nay对此感到惊讶:“我之前以为立法过程主要受党派的影响,政策本身反而不怎么相关。”

这种新鲜的文本分析方法,也让许多政治学家感到眼前一亮。华盛顿大学的John Wilkerson就认为这项研究很有新意,充满前景。

 
举报收藏 0打赏 0评论 0
免责声明
• 
本文为小编互联网转载作品,作者: 小编。欢迎转载,转载请注明原文出处:https://www.1elephant.com/news/show-10598.html 。本网站部分内容来源于合作媒体、企业机构、网友提供和互联网的公开资料等,仅供参考。本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如果有侵权等问题,请及时联系我们,我们将在收到通知后第一时间妥善处理该部分内容。582117289@qq.com。
 
更多>同类防护头条
  • admin
    加关注0
  • 没有留下签名~~
推荐图文
推荐防护头条
点击排行
信息二维码

手机扫一扫

快速投稿

你可能不是行业专家,但你一定有独特的观点和视角,赶紧和业内人士分享吧!

我要投稿

投稿须知

微信公众号:壹象网
微博:壹象网

鄂ICP备15023168号公网安备42010302002114号