加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码门户网 (https://www.92codes.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

使用机器学习和大数据预测心脏病

发布时间:2020-12-24 13:48:54 所属栏目:大数据 来源:网络整理
导读:副标题#e# 编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使
副标题[/!--empirenews.page--]

使用机器学习和大数据预测心脏病

编者按:


现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。


大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使用它,它可以在任何工业上产生影响。在医疗保健领域,它在很多情况下都有重要的使用,例如疾病检测、找到流行病早期爆发的迹象、使用集群来找到瘟疫流行的地区(例如寨卡(zika)易发区),或者在空气污染严重的国家找到空气质量最好的地带。在这篇文章里,我尝试用标准的机器学习算法和像 Apache Spark、parquet、Spark mllib和Spark SQL这样的大数据工具集,来探索已知的心脏疾病的预测。


源代码


这篇文章的源代码可以在GitHub的这里找到。此外,你可以从这里check out出整个eclipse项目。

使用的数据集


心脏疾病数据集是一个已经被机器学习研究人员深入研究过的数据集,它可以在UCI机器学习数据集仓库的这里免费获取。在这里有4个数据集,我已经使用了有14个主要特点的克利夫兰的数据集。这个数据集的的功能或属性如下:


  • age- 用年数表示的年龄

  • sex- 性别枚举(1 = 男性; 0 = 女性)

  • cp: 胸部疼痛的类型

     ? 值为 '1': 典型的心绞痛
     ? 值为 '2': 非典型的心绞痛
     ? 值为 '3': 非心绞痛的疼痛
     ? 值为 '4': 无临床症状
  • trestbpss: 静息血压 (准许入院的毫米汞柱(mm Hg))

  • chol: ?以mg/dl为单位的血清类固醇

  • fbs: (空腹血糖 > 120 mg/dl) (1 = 是; 0 = 否)

  • restecg: 静息心电图结果

    值为 0: 正常
    值为 1: 有ST-T波异常 (T波倒置和/或ST段抬高或压低>0.05 mV)
    值为 2: 显示该标准下可能或明确的的左心室肥厚
  • thalach?: 达到的最大心率

  • exang : 是否运动诱发的心绞痛 (1 = 是; 0 = 否)

  • oldpeak?: 由与相对休息有明显差异的运动诱导的ST段压低

  • slope?: 运动高峰期的ST段斜率

    值为 1: 上斜
    值为 2: 水平
  • ca?: 被透视荧光检查(flourosopy)标注颜色的大血管的数量 (0-3)

  • thal?: 3 = 正常; 6 = 固有缺陷; 7 = 可修复缺陷

  • num?: 心脏病的诊断?(冠状动脉疾病状态)

    值为 0: < 50% 直径缩小 ?(意味着'没有疾病')
    值为 1: > 50% 直径缩小 ?(意味着'出现了疾病')

使用的技术

金融投资数据大全——Choice金融终端年终大回馈

(编辑:源码门户网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读