运用文本挖掘,提炼商业价值

发布者:蓝天飞行最新更新时间:2015-08-11 关键字:运用 手机看文章 扫描二维码
随时随地手机看文章
通常,制造工程师会花大把时间将数字吃透,以确保生产和效率水平始终处于高峰。而今,一家总部位于美国休斯顿的石油设备生产公司的管理者们发现,分析对象除了数字,还可以是文字。结合对这两者的分析,可令制造工艺更加优化。
 
“我们始终期望改进运作模式,使其变得更好、更高效。”FMC科技的全球业务卓越经理Dan Fortune如是说,“而我们发现,文本挖掘能帮助我们有效实现这一目标。”文本挖掘需将单词与词组基于共性进行分类。在FMC科技,这些由制造报告中提取出的字词,将由SAS公司的统计发现软件JMP进行编码及分析。
 
FMC科技是全球石油与天然气设备(包括海底采油、地面井头、海洋装卸作业等专业系统)工业领导者,其生产的一些设备具备在海底近两英里左右深处运行的性能。精确分析工程设计及产品性能,是制造商须长期具备的技能——因为原设计在安装时需调整,所以常易成为可变因素。在FMC,遍布16个国家的30处生产设施需要持续分析与故障排除的服务。
 
运用文本挖掘,提炼商业价值
 
 运用JMP软件分析生产报告中包含的字词,帮助FMC掌握了其全球范围内生产设施的潜在质量问题。
 
 “制造商有很多,可我们是海底设备制造商中的佼佼者。”Fortune表示。Fortune表示,在过去几年中,FMC科技运用JMP软件的统计和图形分析法,使生产工艺更加高效,并大幅节约了成本。
 
“如果我想知道2013年的所有生产缺陷区域,两个员工可能要奋斗整整一周,才能做好。但有了JMP,我15分钟就可以搞定,还可以反复实验、研究,或者以不同的视角来查看结果。”Fortune说。
 
文本挖掘:额外优势
 
对工程师们来说,研究数字是很自然的,但在分析中加入字词能获取额外信息,有助于改善优先次序及问题解决型任务。FMC西部地区海底系统规划经理Gokhan Sarpkaya如是说。
 
 “我们的目标是减少或消除变异。”Sarpkaya表示,“文本数据在这方面具有优势。它能让我们的分析更加深入,有助于决策者做出更优决策。”
 
运用文本挖掘,提炼商业价值
 
为了对生产报告的内容进行分类与分析,FMC将如图所示的JMP定制脚本与开源代码的统计与图形分析软件R配合,实现所需的文本挖掘功能,随后将所得结果返回JMP,进行进一步分析与可视化(见图)。
 
用于分析的文本是从公司数据库内的书面描述中取得,用以标识生产流程中的问题、不规律性或其它情况。 “当问题发生的时候,对于它的书面描述通常十分准确。”Fortune说,“通过文本挖掘,我们可为相似问题分类,即使它们的书面表达方式不同。这样我们就能找出未达到应有水平的项目。这种方式有助实现重大转变。”
 
Fortune可运用JMP选取文本,并使用咨询公司Adsurgo提供的JMP定制脚本,将数据发送至开源代码的统计与图形分析软件R,实现所需的文本挖掘功能。所得结果将被返回JMP,以便进行进一步分析与可视化。该脚本允许用户自定义JMP数据在R软件中的处理方式,且无需编码。
 
运用文本挖掘,提炼商业价值
 
为了对生产报告的内容进行分类与分析,FMC将如图所示的JMP定制脚本(前图所示)与开源代码的统计与图解分析软件R配合,实现所需的文本挖掘功能,随后再将所得结果返回JMP,进行进一步分析与可视化(本图所示)。
 
Fortune表示,文本挖掘功能解决了“词干”和“停用词”问题,使分析结果更加精准。为了解决词干问题,每个单词都被拆解到词根,不论它们在特定句子中呈现何种形式。例如,“正在行走”“行走过”和“行走着”都可由词干“行走”统一归类。“同一词干的词,结尾虽不一样,表达的意思却是一致的。”Fortune这样解释。
 
而停用词,则会在分析开始前从文本中剔除,因为它们对文本内容并不构成实际意义。这类词包括定冠词、代词、“在……上”等之类的介词。“我们用R来降低文本数据的复杂度,并将其构成一个数字矩阵,以便JMP的后续分析操作。这就是奇异值分解法。”Fortune表示,“R将数据返回到JMP,JMP则完成所有的分析工作。”一旦执行以上操作,文本中出现的相似语句就会被分类、添加到专供JMP分析的数值型数据中。
 
运用文本挖掘,提炼商业价值
 
JMP软件分析生产报告,而后在文字云中展示出来,并突出高频词汇和关键活动描述用词。这一过程可帮助分析师快速判别最具普遍性的问题。
 
文本分析能帮助解决数字系统中经常弹出的错误。Fortune说:“编码与文本不匹配的情况常常发生。”Fortune还表示,如数字编码分类太宽泛,对某一问题的具体判断无法获准取得编码,就会出现错误。另外,如编码过于具体,导致系统对指定条目的正确名称决策混乱,也会出现错误。“编码过多,将给数据录入人员的工作带来困难,使他们无法正确进入条目。”Fortune说。
 
用图形分析文本与数据,让管理者们得以在重复性操作过程中发现趋势,例如:从预期起止时间与实际起止时间之间的差异,以及由于个人行为而产生的品质不等。在FMC,这些原本都被视作艰巨任务。“如果我有五个项目,其中包含15000个活动,也就意味着它们包含着75000个条目。”Fortune解释道。
 
“对于人来说,要投身如此巨大的数据中,并结合传达相同意义的不同文本作出分析,基本上是不可能的。但运用文本挖掘与聚类分析,虽也要用一些时间,但比起‘近乎不可能’来已是很好了。”
 
转向JMP
 
JMP还是FMC公司项目优先级划分的重要软件。项目优先级划分是保持领先竞争力的一个重要步骤。此外,JMP也被培训主管们运用于六西格玛项目,以保障生产成品质量,降低成本、提高客户满意度。Sarpkaya说,在去年转用JMP之前,他已用Minitab软件对新用户培训六西格玛体系长达十年。
 
“我十分高兴转用JMP。”他说,“这款软件的客户定制程度较高。你可以撰写自己的文本,这样更灵活些。”
 
运用文本挖掘,提炼商业价值
 
如图所示,FMC科技公司生产的设备,通常用于拓展现有的海底项目,或者在有些只装配传统设备、会被视作不切实际的条件下启动新项目。
 
Fortune说,他极力支持在FMC公司的六西格玛项目中使用JMP软件,因为他曾在之前就职的公司里运用JMP软件,并认为其功能卓越。此前,Fortune曾以一个项目为FMC节省了大量成本;这有助于FMC的高管们认同JMP软件。
 
Fortune说,能源业的设备造价高昂、体积庞大,有些仅零件就重达80吨;而被认定有缺陷、不可靠的零件必须报废,因此FMC公司在某些工程案例中为单个零件就花费了25万美金或更多。2011年进入董事会并担任质量部门领导后,Fortune对判定设备服务期限的测量方法存在怀疑,便运用JMP做了一次分析。
 
“我运用JMP的图形分析功能计算出结果,并向公司里许多完全不懂统计技术的人展示,成功地让他们明白:这中间存在许多问题,我们需要第三方对零件进行评估。”随后的第三方评估结果显示,一些曾被指明报废的零件是可靠的,可以回归使用。其中两个零件的总价值达到40万美元。由此,Fortune为FMC公司节省了近50万美元的成本。
 
不过,Fortune表示,JMP的最大优势在于其提升FMC公司“满足客户期望”能力的方式。“我们公司生产的海底设备,设计几乎全都是独一无二的。”他这样解释,“但我们也制造地面设备,这在市场上的竞争激烈得难以想象。所以,进行精准预测以确保永远满足客户的需求,对我们来说就尤为重要。”
关键字:运用 引用地址:运用文本挖掘,提炼商业价值

上一篇:是德科技参与投资美国集成光子制造创新机构
下一篇:药物探索就如一场数字竞赛

推荐阅读最新更新时间:2024-03-30 23:02

示波器的运用留神思项
仪器运用前仔细阅览阐明书,并分外留神以下的几点阐明: 一、通常示波器的最大输入电压峰值不逾越400V,如操作不妥,超电压输入,将损坏仪器的高阻抗输入端及维护电路,这儿特此提出丈量高电压时的一些留神思项及丈量办法,以便有用地维护仪器,延伸运用寿数,进程如下: 1.衰减开关逆时针旋至5V/DIV档。 2.输入耦合办法中2只开关按下至GND和AC。 3.接上探头(探头置于X10)并连至被测点。 4.将第2条中GND弹出,再恰当调度第1条中的衰减开关,使屏幕闪现信号崎岖适中即可。 二、在丈量状况时,示波管亮度不宜太亮,只需能正常运用即可。长时刻运用,请放在“常态”下查验,以延伸示波管寿数!不然高亮度、长时刻光迹至于示波管某一方位将会烧
[测试测量]
LMS Test Lab在整车路面载荷提取中的运用
1 前言 随着汽车产业的迅猛发展,汽车的乘坐舒适性能如噪声和振动常常成为区分汽车好坏最为直接的重要因素之一。乘用车低频噪声问题一直是目前设计和控制的难点,路面噪声通常可以分为两类,一是轮胎与路面相互作用直接辐射进车内的噪声,称为直接路面噪声;二是由于路面激励,通过悬架系统引起车身振动而产生的结构辐射噪声,称为间接路面噪声。由路面激励引起的结构噪声已成为现代汽车日益关注的焦点。 汽车受路面激励力的作用,通过不同的传递路径引起车身结构的振动,从而向车内辐射大量噪声。为了有效的控制和分析路面噪声,通常需要进行路面噪声传递路径分析,可以通过传递路径试验分析,也可以通过 CAE 仿真 分析,以确定每条路径对目标点(车内噪声)的贡献量
[嵌入式]
2018年俄罗斯世界杯,运用了哪些“智能硬件”?
等了 4 年,这一届的世界杯终于来了,这个牵动超数十亿美元产业,吸引全球超过一半人口关注的赛事,正在俄罗斯境内如火如荼地进行着,同时,32 只来自 5 大洲球队亦在绿茵赛场上为争夺大力神杯,而挥洒汗水。   从球场内的裁决辅助、数据采集,到球场外的观赏体验,这场全球性体坛盛宴,也随着各种高新科技的发展而进行了一次‘升级’。 ▲图片来自:FIFA   除了昨天法国对澳大利亚那场世界杯小组赛中那个‘声名大噪’的 VAR 视频助理裁判技术(Video Assistant Referees)之外,这届俄罗斯世界杯还应用了不少智能硬件,并且它们与体育竞技紧密地结合在了一起。 ▲图片来自:latercera   场上的阿迪达斯 Telsta
[手机便携]
运用C8051F340的数据采集系统电路设计
  本文以带有片上USB 控制器和D/A 转换器的高度集成处理器C8051F340为核心器件,采用SD 卡存储技术利用USB 总线、虚拟仪器实现软件LabVIEW 设计图形用户界面,设计一款低成本数据采集器。该数据采集器可与PC 机共同实现数据采集与分析,也可长时间独立工作于工业现场,并将采集数据存放于大容量SD 卡,便于数据收集并利用计算机分析。   系统的硬件设计主要是数据采集模块。由于C8051F340内部集成了高精度时钟源、USB 控制器、电压调节器、A/D 转换器以及用于A/D 转换的参考电压源等丰富的片上外设,因此在对数据采集模块硬件设计时,无需扩展上述电路,使得系统硬件结构简单,集成度高,可靠性好。如图所示,通过片
[电源管理]
<font color='red'>运用</font>C8051F340的数据采集系统电路设计
嵌入式系统在电源设计中的运用
  引言   在如今的信息时代,由于人们对系统性能和成本控制要求的不断提高,嵌入式系统凭其优良的性价比和独特的便利性得到了越来越多的人们的青睐。本文以基于AT91RM9200的嵌入式控制系统为例,重点分析系统电源电路的设计思路、方法以及系统电源的安装与调试过程,结合调试过程中碰到的问题,对嵌入式系统电路的调试方法及注意事项进行了分析。随着嵌入式系统的广泛应用,电源电路的设计与调试尤为重要,本文的设计与调试思路值得借鉴。   1 系统硬件结构   在基于嵌入式系统的焊接机控制系统设计中,以AT91RM9200作为系统核心微处理器,依据控制系统要求外扩了SDRAM、SRAM、Flash,键盘、液晶显示电路可进行实时参数调整、显示并
[单片机]
嵌入式系统在电源设计中的<font color='red'>运用</font>
堆垛机控制系统设计中PLC的运用
  对于自动化立体仓库而言,巷道堆垛机是一个至关重要的设备。这个设备能够取货于巷道口,送达到指定的特定货格。或者从特定货格将货物取出,放于巷道对应的出货口。 PLC 不但可靠,而且功能非常的强大,能够实现巷道堆垛机之具体的自动控制功能,货物进出库、乃至盘库都可以实现自动化。 1 堆垛机 控制系统 的工作原理   在堆垛机控制系统里面,无论是控制还是记录堆垛机的具体状态,都是由PLC控制的。当前西门子生产的S7-300可编程控制器是所有的堆垛机控制系统的核心。要想实现平稳而且安全的运行,这些技术都需要得到很好的解决:   ①能够在指定货位精准的多货物予以存取,为了实现这个目的,那么作为控制系统,一定要能够对堆垛机的具体位置予以精准的
[嵌入式]
安防突破:红外技术运用解决夜间监视困扰
    红外技术因其在夜间零照度环境下能实现画面的清晰拍摄,在近些年来,被广泛地运用于安防监控领域。随着市场需求的不断增大,安防产业迎来更为广阔的发展空间。红外监控作为安防监控领域重要应用,正在物联网大潮下迅速发展。那么,你具体了解多少呢?     我们都了解夜视技术在军事上的应用有很长时间了,随着技术的发展,目前在民用视频监控中也获得了广泛应用。实际上,夜视技术是借助于光电成像器件实现夜间观察的一种光电技术。它包括微光夜视和红外夜视两类:微光夜视技术是通过带像增强管的一种夜视技术,它实际就是对夜天光照亮的微弱目标像进行增强,以供观察的光电成像技术。     微光夜视仪,是目前国外生产量和装备量最大和用途最广的夜视器材,它
[安防电子]
高速误码测试系统中的C8051F005运用
引 言 随着通信技术的不断发展,通信系统信号处理越来越快。在这种情况下,对于高速通信系统性能的检验,就需要高速误码测试仪。目前市而上已有多种误码测试仪。国内产品的信号处理速度较低,而国外产品的功能虽然比较完善,处理速度很高,但其价格也相对较高。本文根据Vitesse公司的VSC8228芯片特点,利用C8051F005单片机设计出一种价廉的高速误码测试仪。下面将对其软硬件设计,特别是C8051F005与上位机的串口通信以及与VSC8228的SPI通信进行详细探讨。 1 误码测试系统概述 Cygnal公司的单片机C8051F005具有高速8051微控制器内核,速度可达25 MIPS,指令为流水线指令结构,70%的指
[测试测量]
高速误码测试系统中的C8051F005<font color='red'>运用</font>
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
最新测试测量文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved