半导体产业应如何在大数据中淘金？

形形色色设备产生的数据量时刻不停地飞速增长，如何利用每天产生的天文数字量级数据，成为科技业面临的一道难题。

全球互联网吞吐量在2016年为1.2ZB（1ZB相当于10亿TB或1万亿GB），预计到2021年将增长到3.3ZB每年。汹涌上涨的数据洪流，波峰越来越高，在2016年，每天数据流量同比增长了32%，而流量最高的1小时数据吞吐量同比增长了51%。

当上述统计也不完整，实际上没有人知道全球每天产生多少数据，因为并不是所有设备的数据都会连入互联网。

数据量本身意义不大，如何量化数据的价值才是关键所在，但在如何应用数据，以实现其价值方面，当前还没有行之有效的方法。

想挖掘数据的真正价值，就要对天量数字与模拟数据进行过滤，并充分考虑应用场景，这就像沙里淘金，大多数可能无功而返。不过，随着计算力的提高以及大规模并行计算工具的成熟，数据过滤分析--即找到更好的应用数据方法--已经能够创造出颇具市场前景的商业模式。

“众多行业人士指出，不同数据应用方法与其器件和商业模式相互关联，并对其商业、市场以及商业模式产生影响，”Synopsys董事长兼共同CEO Aart de Geus说道，“如果你能够从中找到捷径，提升效率，或者全新的商业模式，那就会是非常大的影响。 ”这也意味着高利润的可能，“你会看到，所有从事数据处理的人都在仔细聆听，以解码市场未来需求，或者自行判断当前市场需求，”de Geus继续说道，“或者更进一步，他们准备置身于数据通路之中，从而最靠近数据商业化的中心。”

这正是资本疯狂涌入的原因，从数据挖掘到云端服务，从机器学习到工业物联网，每一个数据应用场景都战况激烈。

“谁拥有数据，具备数据分析及处理能力，谁就能把所有钱都赚走，”西门子Mentor事业部总裁兼CEO Wally Rhines这样表示。

现在还难说数据应用是一个胜者通吃的游戏，不过确实有不少科技巨头在这个领域跑马圈地，奋勇争先，例如亚马逊、谷歌、微软、Facebook和IBM等掰着手指头就可以输出来的大家伙。

“收集上来的物联网数据中，包含了设备大量的性能、行为及应用数据，”IBM美洲区销售主管Christophe Begue说道，“我们接下来会把收集到的数据丢给Watson（IBM人工智能平台）去分析。”

现在的大问题是如何将这些数据变现，有哪些人愿意为数据付费。要将数据变现，首先要做到如下几点：第一，行业里的公司要真正懂数据的价值；其次，公司要能够快速应对数据变化，只要比别人快百分之一秒，券商就能够以此牟利，但现在大公司应对数据变化的反应时间通常是几天甚至几周；第三，变现数据的价格要有竞争力，不能波动太大。

IBM正准备将全球供应链的数据商业化。“供应链数据分为两层，”Begue说道，“第一层是零售与快速消费品（CPG）等数据，就是那些可能会影响到食品与饮料等销售的数据。你可以在附近的一个商店收集天气、交通或运动赛事等相关信息，并通过交通模式追踪它。我们用Metro Pulse平台来做数据分析，该平台会覆盖500个数据元素，用户既可以购买数据用于深度学习或机器学习分析，也可以全部委托IBM来做分析。第二层即我们正在导入市场的概念：供应商风险。IBM将天气与政局变化等诸多因素纳入考虑，从数据中分析供应链的安全程度，并根据分析结果来提升供应链的安全。如果注意到15个因素有风险，那么你就会对这15个因素严密监控。”

IBM的服务并不是值分析已有数据，还会给出建议，洞见未来。“我们收集公开与半公开数据，有些数据只在IBM内部使用，我们建立预测模型。当然，我们也意识到，在计划和反应之间，仍然存在差距，‘决策室’概念有助于缩小计划和行动之间的鸿沟。”

智能制造

并不只外部收集的数据才有用，工业生产中，内部产生的数据就很有价值。事实上，整个智能制造的概念（德国称为工业4.0，也有人称之为工业互联网）就是如何把内部数据利用好。

“一言以蔽之，工业物联网是为了提升生产效率，”Optimal+市场副总裁David Park说，“现在这些公司都偏爱流程分析和无库存生产，但它们真正需要的是预测性分析。预测性分析可以让工厂受益，不过受益最多的是品牌商，品牌商和工厂可不一定是一回事。”

风险在于，数据不一定都是正确的。基于错误数据而做出的决定，将导致结果难以预期。

“如果数据没问题，那么可以把良率提高2%到3%，非常显著的提高，”Park说道，“供应链上通过检测的任何元器件的所有时间段数据都会被收集。当你拿到一些有划痕的晶圆，根据数据就能查出在哪一个环节晶圆被划破，你也可以查看元器件在现场的老化过程。如果汽车配备了预测性维护服务，那么你就能看到汽车在路上的相关数据。金融业同样会受益，如果你手上有数十万张发票，靠人工是捋不清发票之间的相互关系的。”

这种数据分析对于复杂供应链特别重要，半导体制造本身在数据分析与应用上先进，但整个半导体供应链对数据的应用，并不都能达到制造环节的水平。

“有效利用数据是智能制造顾问委员会（隶属于SEMI）的一大主题，”SEMI协作技术平台副总裁Tom Salmon说道，“获取数据很重要，但现在问题不是我们获取的数据量不够，而是因为数据利用率只有10%左右。真正的挑战在于我们应该问什么样的问题，如何把数据应用于制造。所以可能会有可靠性问题，但不会有制程问题。”

机器学习

找到关键数据，在预设参数下利用机器对数据规律进行外推，这就是机器学习的基础。这种方法已经应用于汽车自动驾驶领域，机器学习系统将辅助并最终取代人类去驾驶汽车，自动驾驶系统做决策时，需要根据行驶场景给出多种预案。

在半导体设计与制造中，也会利用机器学习来提高质量、可靠性及良率。

“采用合适的比例来抽取数据做分析，就能应用于未来的设计，”eSilicon市场副总裁Mike Gianfagna说道，“如何将机器学习算法应用于新领域是关键，在过去7年中，我们在这方面积累了很多经验，我们知道如何挖掘开发数据的价值。当你拥有大量数据时，怎么去抽取分析这些数据？如果抽取数据比例太高，你会迷失在大量数据中，如果抽取数据比例过低，又可能得不出结论。”

Gianfagna表示，在降低风险与增加效率的基础上，实现数据变现是机器学习的目标。“要做到这一点，你需要从全局上来看待大数据分析。”

与很多由大云端服务商提供服务的大数据分析相比，半导体设计和测试行业产生的数据量很少，不过半导体设计与测试数据可能更复杂。

“当前主要任务是收集数据，”NI解决方案市场总监George Zafiropoulos说道，“下一阶段的目标是通过数据分析来给出改进方法。无须刻意寻找，你就能发现数据中的价值吗？你要找的，是数据的趋势和相关性，可以将机器学习应用于任何环节。如果软件提示，本周四产线产出较低，为什么会产出低？或者特定温度与特定电压对产品性能的影响。（这些都可以用数据分析来指导）”

Zafiropoulos指出，可以将更好的芯片设计作为目标。“作为工程师，我们围绕设计来制定规则，但如果你想面面俱到，那么效率就不会高。如果在保证可靠性与性能基础上，可以减少保护规则，那将会有很大价值。很多大数据分析都是针对多个数据采集点，一座城市可能有一万个传感器，每天产生大量数据，而亚马逊的订单更是数不胜数。半导体数据比个人能处理的数据显然要多，但也远达不到亚马逊交易数据这个量级。”

然而，系统数据可能就比设计数据高几个数量级了，特别是涉及多物理层仿真时。“我们认为，7纳米将是首次导入机器学习和大数据分析的节点，数据量将会膨胀，处理速度也需要增加。” ANSYS总经理兼副总裁John Lee说道，“你需要做同步热分析。热效应影响系统的可靠性，但如果数据量增大到当前技术无法解决，那么就要引入新的方法，所以我们需要大数据技术。最新的GPU有210亿个晶体管，而且可应用于汽车，但这种规模的芯片发热量巨大，（如果散热设计不好），发热时会增加对电路板的压力，并可能导致板子弯曲，但要知道，车用芯片使用寿命长达十年。”

总结

大数据分析在半导体产业应用还处于中段（发展期）。一方面，为提高芯片的性能、效率和可靠性，半导体产业的数据量在增长，数据分析任务在增加；另一方面，半导体产业也在发展各种技术，以充分挖掘数据用途。

这为产业带来了新的增长机会。Cadence 总裁兼CEO 陈立武表示，2015年全球联网汽车市场规模为240亿美元，到2020年，将发展到370亿美元，与之相应，深度学习市场规模2020年将达100亿美元（2015年为6亿美元），云和数据中心市场规模将达800亿美元（2015年650亿美元）。“这将给半导体产业带来机会，”他说道，“从优化物联网到云端，都将给半导体带来很大的机会。”

现在的问题是，围绕这些数据还能做些什么，以及到底如何去实现。这将是半导体产业的一个全新机会，也许会推动半导体产业发展登上一个新台阶。

声明：本网站所收集的部分公开资料来源于互联网，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。如果您发现网站上所用视频、图片、文字如涉及作品版权问题，请第一时间告知，我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容，以保证您的权益！联系电话：010-58612588 或 Email:editor@mmsonline.com.cn。

半导体产业应如何在大数据中淘金？

编辑推荐

重点推荐

产品e点通

您关注的品牌

您关注的主题

猜您喜欢

分享到