一、系列介绍

    经济统计著作系列推文将深入浅出地解读国际上具有影响力的经济统计著作。除出版社出版的经济统计著作以外,也包括国际组织(OECDUNWorld BankIMFEU 等)出版的部分经济统计方法论手册和专题论文集,经济统计学主题的博士论文,经济研究机构的部分 Working Paper(工作论文)。

二、著作信息

Kenett, Ron,and Galit Shmueli. 2016. Information Quality: The Potential of Data and Analytics to Generate Knowledge. Vol. 52. Chichester, West Sussex: Wiley.

Information Quality: The Potential of Data and Analytics to Generate Knowledge

英文原版封面

三、引言

    传统统计与数据分析教学往往过度聚焦于技术方法,而忽视了从“数据”到“知识”这一完整实证链条中更根本的问题:一个数据集在特定目标下,通过恰当的分析方法,究竟能在多大程度上产生具有实际效用的信息?为此,作者提出并系统阐述“信息质量(InfoQ)”这一全新框架,将研究目标(g)、可用数据(X)、分析方法(f)与效用测度(U)四位一体地纳入评估体系,通过八大维度对任何实证研究的设计、执行与成果进行前瞻性或回溯性诊断,从而帮助研究者、机构与决策者在资源受限与数据泛滥的时代,最大化地将数据转化为可靠知识与有效行动。


四、作品内容

一、信息质量框架(InfoQ Framework

    信息质量(InfoQ)并非传统意义上的“数据质量”,而是一种更高阶的测度,用来测度在明确目标下,一组特定数据通过某种分析方法所能产生的有用知识潜力。它由四个不可分割的要素构成:研究目标g、数据X、分析方法f和效用U,并用函数式InfoQ(g,X,f,U)=U{f(X|g)} 加以形式化。只有同时审视目标是否清晰、数据是否适配、方法是否恰当、效用是否可测度,才能判断一次数据分析到底有多大可能把数字变成可行动的知识。

    为了让这一抽象概念落地,作者进一步把InfoQ分解为八个可评分维度:数据分辨率、数据结构、数据整合、时间相关性、数据与目标的时序性、可推广性、可操作化与沟通性,并给出量化评估流程——从研究设计阶段的前置优化(实验设计、调查抽样、临床试验伦理)到数据收集后的后置修复(清洗、加权、缺失值处理、元分析),全程用同一套维度清单诊断短板、指导改进,从而把“好数据”真正转化为“好决策”。

二、InfoQ 的应用管理(Applications of InfoQ)

    著作把InfoQ框架拖进现实,在教育、顾客满意度、医疗、风险管理和官方统计五条战线同时试刀。作者先把各领域喊得响亮的政策口号拆成可验证的实证问题,再用八个维度给现成的数据和模型打分。例如美国中小学成绩报告缺误差线也缺行动指引,只能拿33分;教师VAM评估因果链条模糊、宣传口气夸张,停在49分;意大利中学用MERLO测度概念理解、托斯卡纳用电话随访130项指标住院体验,数据多维又能落地,直接冲到68分和81分。这些例子把维度清单当成体检表,一眼就能看出哪些研究能用来决策,哪些还只是课堂里的统计习作。

    横向对比更扎心:同一份问卷,改用贝叶斯网络,顾客满意度InfoQ就从39分飙到87分——网络把文本、运维、地理数据串在一起,还能实时更新、模拟干预。守着SERVQUAL差距法或传统控制图不动,因不管数据源耦合和因果时序,分数依旧垫底。作者用这些落差说明,InfoQ不是学术圈的装饰花,而是硬杠杆。在掏钱做调查、上马算法、颁布政策之前,它就能告诉你信息能不能变成可行动、可推广、可复现的知识,把“数据驱动”升级成“质量驱动”。

三、InfoQ的实施与工具支持(Implementing InfoQ

    作者把InfoQ直接按进日常操作,先把它做成“可重复研究体检表”。投稿前作者按八个维度逐项打分,连同数据、代码一起打包,审稿人一眼就能瞄到哪一维得分低、重复性风险在哪,直观性强。再把同一张表塞进期刊和基金评审,目标清不清晰、数据与结论窗口匹不匹配、模型是不是只给p值、结果能不能转成行动,四步速查让“低InfoQ直接出局”,评审标准从“新颖”改成“可用”。

    著作把整套框架拆成6学时工作坊,学生自带课题现场填表找短板,立刻用RMinitabJMP的现成模板补采样、补缺失、把系数换成成本-收益,结课交出“可执行摘要”,毕业要求从“考过统计”升级为“交付高InfoQ报告”。后续又给出三段落地代码:Rinfoq包一行命令画雷达图并附修补脚本;Minitab在“协助”菜单里新增InfoQ按钮,后台自动匹配实验设计或插补方案;JMP的“InfoQ 仪表板”拖进数据就实时算分,低分维一键跳到对应平台,把诊断-改进-验证缩成一条流水线,让人把这套评分表当成项目管理的SOP(标准操作规程),而不是论文里的漂亮词。


四、用InfoQ标尺把数据变可行动知识的全程指南

    著作用目标、数据、方法、效用四要素定义InfoQ,再拆成数据分辨率、结构、整合、时序、可推广、可操作、沟通等八个维度,让“好数据”不再凭感觉,而是可打分、可追踪。随后把这套体检表投进投稿、审稿、基金评审流程——作者打包数据时附一张自评表,审稿人四步速查就能剔除只给p值的“花架子”。基金评审用同一把尺子,目标不清、结论落不了地的申请书直接被挡在门外。教学场景里,学生带着自己的课题现场填表找短板,用RMinitabJMP的现成模板补采样、补缺失、把系数换成成本收益,结课交出“可执行摘要”,毕业标准从“考过统计”升级为“交付高InfoQ报告”。案例横跨美国中小学成绩报告、意大利中学MERLO测评、托斯卡纳住院体验监测、顾客满意度七模型混战,同一份问卷换贝叶斯网络能把得分从39拉到87,证明InfoQ不是学术装饰,而是立项前就能算清的硬杠杆。作者的美德在于先算清,再掏钱,让每一次分析都能把数字变成可行动、可推广、可复现的知识。

五、作者介绍

Ron Kenett

    Ron Kenett的职业生涯始于以色列政府统计体系,曾在中央统计局任高级研究员,随后转入工业界,历任KPA集团首席执行官,并在以色列、欧洲多所高校穿梭任教,特拉维夫大学、都灵大学、卢布尔雅那经济学院均留有他的教席,现任以色列统计协会与欧洲工商统计网络前主席、英国皇家统计学会会士,兼具政府统计官、企业掌门人和跨校教授的复合身份。

    学术上,Kenett聚焦工业统计、质量管理与数据科学交叉领域,发表学术论文逾两百篇,出版  《Modern Industrial Statistics: With Applications in R, MINITAB and JMPInformation Quality: The Potential of Data and Analytics to Generate Knowledge》等十二部专著。他提出的“信息质量(InfoQ)”框架被用于教育测评、顾客满意度、医疗风险等场景,并开发出配套 RMinitabJMP 工具包;因“将统计方法转化为企业决策利器”的贡献,获英国皇家统计学会2013年度格林菲尔德奖章,其作品已成为六西格玛与数据科学教学的核心参考书。


Galit Shmueli

    Galit Shmueli是一位以色列数据科学家,现任台湾清华大学服务科学研究所特聘教授,并自2020年起担任该所所长。她曾在马里兰大学罗伯特·史密斯商学院任教,并在印度商学院、不丹Rigsum研究所等多所国际机构担任访问或常驻教授职务。

    她的研究聚焦于商业统计、数据挖掘与信息质量,尤其以区分统计模型中的“解释”与“预测”目标而闻名。她著有多部权威教材,如《Data Mining for Business Intelligence: Concepts, Techniques, and Applications in Microsoft Office Excel with XLMiner》和《Information Quality: The Potential of Data and Analytics to Generate Knowledge》,并于2020年被授予国际数理统计学会(IMS)会士荣誉,以表彰其在生物监测、电子商务与信息质量等领域的杰出贡献。



图片来源:

https://zh.101run.ru/book/2850692/b87244/information-quality-the-potential-of-data-and-analytics-to-generate-knowledge.html

https://uravconf.com/2024/director/prof-ron-kenett/

https://i1.rgstatic.net/ii/profile.image/272460645924876-1441971088326_Q512/Galit-Shmueli.jpg