加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码门户网 (https://www.92codes.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

使用机器学习和大数据预测心脏病

发布时间:2020-12-24 13:48:54 所属栏目:大数据 来源:网络整理
导读:副标题#e# 编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使


疾病预测层(参考Github的代码)

现在,使用Apache Spark加载测试数据到一个RDD。

对测试数据做模型适配和清除。

使用spark mllib从存储空间加载模型。

使用模型对象来预测疾病的出现。例如:


NaiveBayesModel _model = NaiveBayesModel.load(<Spark Context>,<Model Storage Location>);

代码的截取如下所示:


SparkConfAndCtxBuilder ctxBuilder = new SparkConfAndCtxBuilder();
JavaSparkContext jctx = ctxBuilder.loadSimpleSparkContext("local");

JavaRDD<String> dsLines = jctx.textFile(testDataLoc);
JavaRDD<Vector> fRdd = dsLines.map(new TestDataToFeatureVectorMapper());

NaiveBayesModel _model = NaiveBayesModel.load(jctx.sc(),modelStorageLoc);

JavaRDD<Double> predictedResults = _model.predict(fRdd);
List<Double> prl = predictedResults.collect();for (Double pr : prl) {
 ? ?System.out."Predicted Value : " + pr);
}

上述设计的问题

任何疾病预测系统的最重要的问题是准确度。一个错误的阴性的结果可能是一个危险的预测,它可能导致一种疾病被忽视。

深度学习已经发展到能够比普通机器学习算法提供更好的预测。在之后的一篇文章中,我将尝试探索通过深度学习神经网络做同样的疾病预测。

总结


使用像?Apache Spark这样的工具和它的机器学习库,我们能够轻易地加载到一个心脏病数据集(从UCI),并训练常规机器学习模型。这个模型稍后会在测试数据上运行,用来预测心脏疾病的出现。



来源:可译网



(编辑:源码门户网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读