使用机器学习和大数据预测心脏病

发布时间：2020-12-24 13:48:54 所属栏目：大数据来源：网络整理

导读：副标题#e# 编者按：现在公众号有置顶功能了，大家把微信更新到最新版本，点开“大数据实验室”公众号。点“ 置顶公众号”键，就可以置顶了，这样。不管我们什么时候更新，您都能容易找到。大数据和机器学习的组合是一项革命性的技术，如果以恰当的方式使

疾病预测层（参考Github的代码）

现在，使用Apache Spark加载测试数据到一个RDD。

对测试数据做模型适配和清除。

使用spark mllib从存储空间加载模型。

使用模型对象来预测疾病的出现。例如：

NaiveBayesModel _model = NaiveBayesModel.load(<Spark Context>,<Model Storage Location>);

代码的截取如下所示：

SparkConfAndCtxBuilder ctxBuilder = new SparkConfAndCtxBuilder();
JavaSparkContext jctx = ctxBuilder.loadSimpleSparkContext("local");

JavaRDD<String> dsLines = jctx.textFile(testDataLoc);
JavaRDD<Vector> fRdd = dsLines.map(new TestDataToFeatureVectorMapper());

NaiveBayesModel _model = NaiveBayesModel.load(jctx.sc(),modelStorageLoc);

JavaRDD<Double> predictedResults = _model.predict(fRdd);
List<Double> prl = predictedResults.collect();for (Double pr : prl) {
 ? ?System.out."Predicted Value : " + pr);
}

上述设计的问题

任何疾病预测系统的最重要的问题是准确度。一个错误的阴性的结果可能是一个危险的预测，它可能导致一种疾病被忽视。

深度学习已经发展到能够比普通机器学习算法提供更好的预测。在之后的一篇文章中，我将尝试探索通过深度学习神经网络做同样的疾病预测。

总结

使用像?Apache Spark这样的工具和它的机器学习库，我们能够轻易地加载到一个心脏病数据集（从UCI），并训练常规机器学习模型。这个模型稍后会在测试数据上运行，用来预测心脏疾病的出现。

来源：可译网

（编辑：源码门户网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

7/9

首页

尾页

全域感知鸟眼人工智	数据项目成功的三个必
孩子的工程思维计算思	将大数据转化为营销收