原文
,卷数:13(1)
基于大数据分析的交互式仪表板对乳腺癌的预后和诊断
- *通信:
- Sandhya P印度理工大学科学与人文学系助理教授,印度金奈600062电话:9786433290;电子邮件: (电子邮件保护)
收到:2016年1月17日;接受:2017年2月27日;发表:2017年3月1日
引用:张丽娟,张丽娟。乳腺癌的诊断与预后癌症通过大数据分析使用交互式仪表板。生物工程学报,2017;13(1):128。
摘要
背景:癌症目前情况的危及生命的疾病是哪些乳腺癌症是女性第二大致命疾病。有几个阶段癌症以及早期发现乳房癌症可以降低死亡率。乳房的初步检测癌症是乳房x光检查,由于放射科医生对疾病的肉眼预测,他们建议进行下一级诊断,如MRI, PET或活检。这些测试既耗时又不划算。在这项工作中,我们的目标是一个交互式仪表板方法,以确定是否存在一个不同的质量称为肿瘤在乳房x线摄影图像中。在这里,我们也倾向于通过使用图像处理技术分析肿块的形状来确定肿块是良性还是恶性。我们还预测了确定乳房分期的可能性癌症使用大数据和云作为下一个层次的计算机辅助方法癌症检测。方法:在本文中,我们也使用反向传播和支持向量机系统(SVM)来分析良性或恶性癌症,我们也可以预测的阶段癌症使用乳房x线摄影图像。结论:在nntraintool中执行的结果决定了测试图像的表现率、训练状态、回归和误差直方图。而云计算和大数据分析的理念则暗示了家庭层面的下一个层次癌症阶段的预测。
关键字
微钙化物质;PET扫描;nntraintool;安;支持向量机
介绍
乳房癌症最常见的诊断是什么癌症在美国女性中乳房癌症根据不同的阶段,疾病的危险因素也会增加。的癌症如果及早诊断出这种疾病,死亡率有望降低。建议女性定期进行乳房x光检查,以降低患乳腺癌的风险癌症尤其是对女人来说家庭历史的癌症[1]。世卫组织的特别机构国际研究机构癌症评估女性乳房死亡的过期率癌症每年40万,并逐年递增[2]。乳房发育的不同阶段癌症被分为不同的阶段肿瘤乳腺的大小及其对辅助淋巴结和其他人体器官的侵袭[3.]。以下是乳房发育的阶段癌症解释的特点癌症细胞。
第一步要检测癌症在人体中是通过乳房x光检查。乳房x光片图像由放射科医生目视检查,并报告存在癌症以正或负的形式给出。由于光学疲劳,乳房x线摄影图像视觉概念的准确性较低(表1和图。1)。为了提高乳房x线片的阅读准确性,我们可以采用计算机辅助设计、神经网络、图像处理等技术。4]。在之前的一些工作中,他们专注于提高乳房x光检查读数的准确性,简化疾病检测,并帮助患者自我确认疾病和疾病阶段,而不是听取第二意见。在一些情况下,乳房x光检查导致对非癌性生长的误解,这种预测可以被称为阳性的假阳性值和阴性的假阴性值。亦有若干个案显示第一类错误,即阳性个案出现假阴性错误[5]。这就导致了严重程度不明癌症由于在短时间内增殖速度高。有时,即使是高密度的乳房,由于缺乏准确性,乳房x光摄影对癌细胞存在的信息也很少,通常放射科医生会指导患者进行下一阶段的检测,如MRI, PET扫描和活检。在这种情况下计算机科学为疾病诊断创造了一个很好的平台,降低了成本和时间[6,7]。在计算机技术的帮助下,乳房x光检查的结果有助于预测癌症和癌症呈现为良性或恶性的各种技术,如机器学习技术,深度学习方法和计算机辅助设计技术被用来检测的存在癌症细胞从乳房x光照片上看。人工神经网络(Artificial Neural network, ANN)是激发人类对复杂非线性函数建模的最常用工具。这模型识别图像模式并帮助检测乳房x光图像中的肿块[8,9]。
阶段 | 定义 |
---|---|
阶段0 是癌原位 |
肿瘤尚未生长出原发部位并侵入邻近组织。它们包括: 导管癌原位 小叶癌原位 |
阶段1 | 肿瘤大小<2cm;转移其他器官和组织不可用 |
阶段2 | 肿瘤横切面<2cm并累及淋巴结或肿瘤从2厘米到5厘米未累及腋窝淋巴结 |
阶段2 b | 肿瘤横切面大于5cm(腋窝淋巴结研究结果为阴性)癌症细胞)或肿瘤直径2 ~ 5cm,腋窝淋巴结受累 |
3阶段 | 也被称为乳腺癌的局部扩散:肿瘤超过5厘米有扩散到腋窝淋巴结或肿瘤任何尺寸的转移腋窝淋巴结,彼此或与周围组织编织在一起 |
阶段3 b | 任何大小的肿瘤转移进入皮肤、胸壁或乳腺内部淋巴结(位于胸部乳房下方) |
阶段3 c | 任何大小的肿瘤,扩散范围更广转移淋巴结也会增多 |
第四阶段 | 定义为肿瘤的存在(无论大小),扩散到远离胸部的身体部位(骨、肺、肝、脑或远处淋巴结) |
表1:随着时间的推移,患者和控制的结果。
计算机辅助检测应用于医学最近减少了医疗费用。该技术用于确定可疑病变,并确定特定病变的恶性程度。这项技术的检测方面,CADe有助于从输入图像中识别和定位癌变区域而CADx系统有助于诊断疾病并将癌变部位分类为良性或恶性组织[10-13]。的癌症检测CADe工具采用基于区域或基于像素的算法从乳房x线摄影图像中提取感兴趣区域(roi)。这些方法考虑肿瘤的大小、颜色和形态。当输入给料的尺寸和形态肿瘤输入到算法中有助于检测该区域是癌变还是正常。通过任何乳房x线摄影图像的清晰度和边缘区别,计算机辅助设计搜索一个特定的肿块,表明恶性肿瘤的可能性更大。在对图像进行质量区分后,需要对图像进行更高分辨率的区域提取。下一步是将提取的图像分类为良性或恶性[14-17]。微钙化是小的钙沉积,可能是钙化开始阶段的标志癌症在未来。利用小波变换、局部阈值等技术定位图像中的高空间频率以定位钙化[18,19]。就在乳房x光检查,核磁共振和PET之后活组织检查是确认癌症等级的必修课。通过使用CADx系统将图像提取出来并期望得到肿瘤肿块可预测为良性或恶性[20.]。本工作的主要目的是利用图像处理技术、神经网络进行预测肿瘤并通过反向传播和支持向量机算法对天气进行检测提取肿瘤是良性的还是恶性的。在这里,作为计算机辅助预测的下一个层次,我们提出了一种确定提取的方法肿瘤作为阶段I, II, III或IV的图像。与传统的方法相比,该方法具有更好的准确性,并且减少了时间和成本消耗癌症阶段检测。
材料与方法
提出了系统
本文提出了一种独特的数字乳房x线照片读取方法。有几种计算机辅助和图像处理方法来确定乳腺癌的存在。在本文中,我们提出了一种方法来确定乳房的存在癌症采用深度学习算法。这里我们实现使用各向异性扩散滤波算法,以减少图像噪声,是观察到的阴性乳房x光图像。乳房x光图像受到峰值信噪比,均方误差和对比度噪声比作为图像质量的衡量标准,以增加图像的清晰度。我们还使用反向传播和支持向量机作为优化和回归分析。
大数据分析
对于分析和存储大量乳房x线摄影图像,大数据分析是一种解决方案。大数据的生命周期是主要的预测系统。该系统刺激预测模型,分析疾病模式和统计工具和算法,以改进临床试验设计等。该系统是初始阶段,但是未来的研究,而一些巨大的数据分析的研究是有希望的更健康的人口,预期寿命的增加和减少健康护理费用(Scheme.1)。
计划。1:乳腺诊断的完整流程图癌症通过大数据分析,使用交互式仪表板。
机器学习
基于人工神经网络和支持向量机的机器学习预测的精度更高肿瘤检测及微钙化分化。肿块和微钙化需鉴别以鉴别a肿瘤良性的或恶性的因此,通常通过肿块的形状和边缘来进行区分(图。2)。系统通过表面模式决定质量形状是规则的还是不规则的。在大多数情况下,规则图像是良性的,而不规则图像是恶性的[21-23]。
以下是其中的几个机器学习方法:
基于svm的无特征方法
•这里SVM使用2个分类器,而质量检索由第一个SVM执行,另一个减少误报。
•乳房x线摄影图像的输入数据集用作与测试图像进行比较的来源。存储的输入图像是经过训练的图像,使用基于人工神经网络的分类器和逻辑回归来完成。
•自动化CAD通过使用基于边缘的分割来提取ROI,帮助改进测试图像。
•通过以下五个模块(预处理、滤波、增强、特征提取、分类),从测试图像中提取的ROI图像中得出良性或恶性组织的结论。
预处理
对输入图像进行预处理,以识别与正常乳房图像相比的任何异常[24]。
步骤1:测试图像叠加在正常乳房图像上,以限制进一步分析的兴趣区域(ROI)。正常乳房图像与测试图像的唯一区别就是肿瘤。这个特定的肿瘤区域将被提取,并被认为是感兴趣的区域。
步骤2:在我们的第一个模块中,我们降低了散斑噪声,这种噪声会降低合成孔径雷达(SAR)、有源雷达、医学超声和相干断层扫描图像的图像质量。
步骤3:图片保存为JPG、DICOM和PGM格式,尺寸更改为256*256或512*512
步骤4:计算图像的大小。
步骤5:斑点噪声的减少是通过将图像转换为灰色来实现的。
过滤过程
非线性中值滤波是图像处理中常用的一种主要的降噪方法。大多数图像在光照和强度上都有变化。还有一种可能是对比度差,导致直接使用图像时不舒服。由于这个主要原因,我们遵循一个称为滤波的过程来转换图像的像素强度来改善损坏的图像,并且这个过程通过去除噪声来提高图像的对比度,并有助于揭示图像的某些微小特征。将会进行模板匹配,以检测图像的已知模式与给定的背景图像[25]。
步骤1:在下一个模块中,我们将在matlab中使用中值滤波
步骤2:B = medfilt2 (A)
中值滤波在二维空间中对矩阵a进行中值滤波。得到的输出以像素为单位,结果包含输入图像中相应像素周围3 × 3邻域内的中值。
步骤3:Perona-Malik扩散,是各向异性的另一个名字扩散是一种在不影响图像或从图像内容中去除任何重要部分的情况下执行降噪的技术。
增强的过程
为了提高数字图像质量和调整图像质量,通常采用放大过程。在这里,我们可以使图像变亮,去除噪声,也可以锐化图像,这有助于更容易地检测关键特征[26]。
步骤1:为了执行增强过程,采用了直方图技术。
步骤2:直方图(X)创建X的直方图,其中执行自动存储。这样做是为了减少微小的观测误差。主数据值使用自动分桶算法,该算法返回具有统一范围的箱子,该范围覆盖X中特定范围的元素,聚焦分布的背景形状。
特征提取过程
在图像处理中,基本特征提取给出一组初始值,并发展出一组期望具有信息量和非冗余的派生值[27]。这将导致以下步骤:
步骤1:需要执行的算法的大量输入数据可以转换为一组减少到有限大小的特定特征。
步骤2:提取的特征与必要的输入用于进一步的处理,因为它比使用更大尺寸的完整图像更好。
分类过程
这里使用支持向量机算法作为最后一个过程来区分和分割-ve和+ve。
If -ve“乳房”癌症“Not confirmed”是得到的结果。
如果确诊为“乳腺癌”,我们分析一下是什么样的乳房癌症使用反向传播和支持向量机。
反向传播
多层前馈神经网络是一个基本的结构单元,其中有一个具有特征特征的多个输入馈源,可以与输出图像进行比较。多层输入只起到传递输入矢量馈送给网络的作用。现在,与输入层有连接的隐藏层也通过连接权连接到输出层。
反向传播算法的变化如下:
最小化误差的唯一方法是使用梯度下降[R (θ)],在这种情况下称为反向传播[28]。更新后的权重和偏差如下,
让。然后:
其衍生词如下:
这些导数给出(r + 1) st迭代,其中学习率表示为γr:
它的简化导数是,
的δki和s心肌梗死数量被称为“误差”吗?
输出层误差
它们的定义满足反向传播方程:
采用两通道算法分别作为前向通道和后向通道对误差进行检查。
对错误的惩罚,地点:
算法
支持向量机算法:这是一种监督式学习模型使用一种学习算法,使用输入数据给出回归分析的结果。一种称为核技巧的非概率二元线性分类将它们的输入映射到高维特征空间中。它是一个具有无限维空间的超平面,用于回归计算、分类等。
超平面设置了一个核函数k(x, y)向量在空间中。
超平面向量参数:α我
超平面特征向量:x我
超平面特征空间:x
它们在空间中映射为以下关系:
神经网络训练工具:nntraintool的功能提供了隐藏层和隐藏层神经元基于工具的复杂性。其功能特点如下:
•公式
•数据
•隐藏数据
•阈值
•重复
•起始重量
•算法
隐藏神经元的数量应该根据所需的复杂性来确定。
Levenberg-Marquardt
二阶训练速度遵循准牛顿方法,其中Levenberg-Marquardt算法被设计[29]。
该工具有助于给出以下结果
•性能
•培训状态
•误差直方图
•回归
现有制度及建议制度
性能感知器与支持向量机的比较
在下面的图表中,我们可以非常明显地发现,与支持向量机(SVM)工具相比,感知器(之前使用的计算机辅助工具)的准确性较低(图。3)。
性能反向传播与支持向量机的比较
利用人工神经网络的两个重要工具进行了比较。工具的性能以图表的形式显示。该图表说明了反向传播和支持向量机的性能是有效和准确的,并且具有高性能的速率(图3 b。)。
结果
本文建立了一种独特的、高精度的计算机辅助乳房预测方法癌症分析。的用法人工神经网络用支持向量机和反向传播算法对质量进行分类肿瘤作为良性或恶性已被发现是一种非常有效、精度高的方法。与反向传播和支持向量机工具相比,先前使用的工具感知器表现出较低的性能。乳房的存在癌症以及乳房的分类癌症可以用神经网络工具进行高精度的计算和验证。在本文中,我们还提出了一个新的研究领域,可以将提取的感兴趣区域与一系列输入图像进行比较,以确定图像的形状和大小。一旦确定了图像的大小,我们就可以预测乳房的分期癌症乳房的早期测定癌症是可以治愈的。同样的协议延伸到乳房的下一个阶段的确定癌症也可以用同样的方法进行推广和证明。
测试图像作为输入(图。4)与健康的乳房图像进行比较。我们提供的测试图像显示有肿瘤存在。这个测试图像被调整大小和过滤,以确定乳房的质量区域(图。5)。当图像在正常图像上进行叠加时,只有期望的质量是肿瘤是杰出的。在该测试图像中,对质量进行了图形滤波,以增加图像中的模糊度,并将其区分为感兴趣区域(ROI) (图6。)。过滤后的图像提高了确定ROI的准确性。分别提取ROI图像,对图像进行侵蚀和分割,去除图像中的噪声(图。7)。对去除噪声的图像进行分析,以确定图像的钙化程度和形状(图8。)。根据ROI将肿块分离并检测,最终结果为“乳腺癌”(图9。)。
图8:流程输出5。强化和钙化癌症地区。
图9:6.处理输出乳房的存在癌症确认。
对于乳腺的分类癌症要判断肿块是良性还是恶性,需观察肿块的主要分析。如果提取的肿块是特定形状的可能是圆形的,那么癌症还没有开始向周边地区扩散。所以,如果观察到的质量是圆形的或者有特定的形状,那么癌症预期可归类为良性。如果在提取的质量中观察到任何不规则形状,则可以将其推断为肿瘤已经开始向周边地区扩散,形成不规则的团块。观察到的不规则肿块可能是恶性肿瘤。的肿瘤将确定的输出输入到神经网络训练工具(图10。)执行了几个任务,以确认图像提取和结果预测的准确性。训练工具给出一个性能结果,显示一个均方误差图,作为与训练集和测试输入的比较(图11。)。该工具还给出了输入图像的误差直方图结果、回归图和训练状态(图。12-14)。这些工具用于确认所执行过程的准确性。
讨论与结论
本文建立了一种独特的、高精度的计算机辅助乳房预测方法癌症分析。的用法人工神经网络用支持向量机和反向传播算法对质量进行分类肿瘤作为良性或恶性已被发现是一种非常有效、精度高的方法。与反向传播和支持向量机工具相比,先前使用的工具感知器表现出较低的性能。乳房的存在癌症以及乳房的分类癌症可以用神经网络工具进行高精度的计算和验证。
在本文中,我们还提出了一个新的研究领域,可以将提取的感兴趣区域与一系列输入图像进行比较,以确定图像的形状和大小。一旦确定了图像的大小,我们就可以预测乳房的分期癌症乳房的早期测定癌症是可以治愈的。同样的协议延伸到乳房的下一个阶段的确定癌症也可以用同样的方法进行推广和证明。
致谢
我们感谢并非常感谢Veltech Dr. RR和Dr. sr University在实施这项工作中的支持。
参考文献
- Ireaneus Anna Rejani Y, Thamaraiselvi S. Breast癌症检测使用多级阈值。计算机科学不安全。2009; 6:25-32。
- Edriss Ali E, zhifeng W.归因CC BY breast癌症使用支持向量机和神经网络进行分类。Int JSciRes。2014; 5:6-14。
- Al Muhrib TK, Al raheem SN, Atoum MF等。乳腺癌tnm分期及分型(家族性和非家族性)癌症在约旦女性中。中华医学杂志,2010;47(1):94- 98。
- 卫生部?dRasoul A, al - hadidi, Mohammed Y等。解决乳房x光检查问题癌症检测利用人工神经网络和图像处理技术。中华生物医学杂志,2012;5:74-84。
- 李建军,张建军,张建军,等。乳腺x光检查中漏诊肿瘤的分析。OJRad。1992; 184:613-7。
- 有或无一级亲属患有乳腺癌的妇女的乳房x光筛查表现。Ann Intern Med. 2000;133:855-8。
- 放射学中的计算机辅助诊断。AcadRadiol。2002; 9:1-8。
- Kumari M, Godara s数据挖掘分类方法心血管病预测。中国生物医学工程学报,2011;22(2):391 - 391。
- Abbass HA,一种进化的人工神经网络方法癌症诊断中华医学杂志,2002;25:265-71。
- 盖蒂DJ。增强诊断图像的解释。投资放射。1998;23:24 -5。
- 基于多模态计算机辅助诊断的乳腺病变分类:独立临床数据集的观察者研究结果。中华口腔医学杂志,2006;32(2):357- 368。
- 霍忠。计算机辅助诊断的有效性:基于独立乳腺x线照片数据库的观察研究。AcadRadiol。2002; 224:560-8。
- 姜莹:改善乳房癌症诊断采用计算机辅助诊断。AcadRadiol。1999; 6:22-33。
- Matsubara T.基于自适应阈值技术的数字乳房x光片质量检测算法的发展。中华医学杂志,1996;1:391-6。
- 刘建军,刘建军,刘建军,等。一种新型的乳房X光片肿瘤自动检测方法。中华医学会影像医学杂志。1990;9(1):233-41。
- 钱伟。数字乳房x线摄影:肿块检测的自适应和非自适应CAD方法的比较。AcadRadiol。1999; 6; 471 - 80。
- 制动器GM, karssemeijn, Hendriks JHCL。数字乳房x光片中恶性肿块与正常组织的自动鉴别方法。中华医学杂志。2000;45:28-32。
- 一种改进的计算机辅助诊断方案,利用小波变换检测数字乳房x线照片中的聚集性微钙化。AcadRadiol。1996; 3:621-7。
- 最优边际分类器的训练算法,见:第五届计算学习理论年度研讨会论文集。1992年10月,日内瓦。
- Nishikawa RM,等。数字乳房x线照片上聚集性微钙化的计算机辅助检测。印度药物。2012;33:174-8。
- Marzban C. ROC曲线及其下面积作为绩效衡量指标。印度药物。2004;19:1106-14。
- 生成简明准确的乳腺分类规则癌症诊断中华医学杂志。2000;18(6):591 - 591。
- BelciugS。两个阶段的决定模型乳房癌症检测。数学和计算机科学系列。2010;37:27-35。
- DanjumaKJ。绩效评估机器学习算法在术后预期寿命肺癌症病人。中华医学杂志。2000;16:106-13。
- 李建军,李建军,李建军,等。大数据:创新、竞争和生产力的下一个前沿。放射学杂志,2011;5:420-8。
- Noble M, Bruening W, Uhl S,等。计算机辅助乳房x光检查癌症筛选:系统评价和荟萃分析。中华癌症杂志,2009;10:279:281。
- Paulin F, Santhakumaran A.乳腺的分类癌症通过比较反向传播训练算法。[J] .计算机科学与信息学报,2011;3:327-32。
- 张建军,张建军。梯度下降学习中批量训练的低效率问题。神经网络的intj。2003; 16:1429-51。
- Shantha Lakshmi G, Mohamed Faize Basha b癌症检测采用基于IGVF模型的图像处理。[j] .计算机工程与信息技术,2014;16:39-43。