来自巴比伦卫生与大学学院的一组研究人员共同创建了一种算法,他们声称该算法可以发现重叠医学数据集中信息之间的因果关系。他们写了一篇描述其算法的论文,并将其上传到arXiv预印服务器。他们还将在今年的人工智能促进协会会议上作一个介绍其研究的演讲。
在AI研究中,找到一种系统的方法来筛选数据以查找单个患病者中给定病因的原因是一项重大挑战。如果患者最近打喷嚏的次数超过正常水平,是否是因为过敏原已引入其环境中?还是感冒了?更糟糕的是,他们的鼻窦或大脑可能患有癌性肿瘤。在这种情况下寻找正确答案的当前系统是基于人的。医生提出问题并在记忆中寻找答案。如果找不到他们,他们可以咨询其他医生或学习医学教科书或在线数据库。
该系统具有其优点,当然,它是最好的。但是它也有缺点-它受到人类记忆力和机智的限制。许多计算机专家认为,有更好的方法-让计算机来做。目前尚无法实现,但科学家正在对此进行研究。在这项新的工作中,研究人员推出了一种带有算法的系统,该算法可以分析来自完全不同的重叠数据集的数据并查找因果关系。
该算法基于熵的概念,其中随着时间的流逝,任何系统都会变得更加混乱。研究人员提出,数据集中的信息也存在熵,并且因果力比描述其影响结果的数据更有序。在这种情况下,应该有可能进行反向工作以找到原因,而这正是他们的算法所要做的。
当比较已知因果关系的数据集时,该系统能够正确评估乳腺癌肿瘤的大小和质地-它确定它们之间没有因果关系,但两者都是肿瘤是良性还是良性的指标恶性的。