本刊专稿:体育学质性与量化研究:差异、误区与应对
《上海体育大学学报》2024年第4期
编者按
为提升体育学研究方法应用的科学性和规范性,助力体育学良性发展,本刊组织国内5名学者对体育学质性与量化研究的差异、应用误区与应对策略进行专题研讨。清华大学胡孝乾认为,质性与量化研究存在直观性、操作性、本质性3个层面的差异,直观性差异是2类研究本质差异的外在显现,操作性差异是判断质性或量化研究的直接标准,本质性差异不仅导致了上述2种差异,而且是社会科学研究者选用哪一种研究方法的根本原因。上海体育大学熊欢认为,在体育学质性研究中存在认识层面、研究设计层面、逻辑推理层面和操作层面等四重误区,在使用或评估具体质性研究时,需要考虑其设计、执行和分析的整体性,以及如何在特定的研究背景中应用其发现。国家体育总局体育科学研究所王富百慧认为,在体育学量化研究能力有待提升的同时,应保持对体育学研究中“量化至上”倾向的警醒,体育学量化研究的逻辑起点是思想与方法的平衡,既要用科学的方法研究问题,更要时刻保持理论反思的态度。上海师范大学李刚认为,当前我国体育学量化研究主要在样本数据、指标设定、计量模型、结果解读等方面存在问题,体育学研究者应树立信心、苦练内功、立足现实、坚持操守。首都体育学院李骁天认为,我国体育社会科学研究方法应用主要存在理论基础薄弱、研究设计缺陷、模型选择偏误等问题,增强问题意识导向及中国体育社会科学理论创新是提升研究质量的首要步骤,同时应加强因果推断方法和数据挖掘的应用以及跨学科方法的融合。
本文引用格式
专家组.体育学质性与量化研究:差异、误区与应对[J].上海体育大学学报, 2024, 48(4): 1-12
质性研究与量化研究的三层差异
质性研究(qualitative research)和量化研究(quantitative research)是社会科学领域常见的研究方法,二者在多个层面存在明显不同。例如,这2种研究方法在研究数据(data)方面存在直观的差异,它们也有各自的优势——质性研究长于深度探究问题,量化研究善于进行大规模调查。有学者明确提出,上述可见差异在本质上是这2种研究方法迥异的哲学立场造成的结果。而且,也正是它们截然不同的哲学立场,导致这2种研究方法虽然长期并存于社会科学研究领域,却较少在一个研究中同时出现——尽管存在同时使用量化和质性方法的混合研究,但也有很多学者从哲学基础与研究范式层面对其提出了批评和质疑。
本文通过借鉴Roy Bhaskar对批判实在主义(critical realism)分层本体论(stratified ontology)的观点,论述了这2种研究方法在直观性、操作性、本质性层面的差异,并尝试以一个奥运遗产研究案例说明3个层面差异间的关系。
1
直观性差异
直观性差异意指读者能够在研究报告中直接读到的不同之处,主要包括研究数据、研究问题、研究结果方面。这一概念对应的是分层本体论中的“经验层(the empirical)”社会实在——社会行为者可以直接体验到的社会实在,即个体可以通过眼耳鼻舌身感受到的社会事件。
在研究数据方面,读者在阅读研究报告时可以直接发现2种研究会使用不同类型的研究数据—量化研究主要使用数字型的数据,质性研究的数据则多种多样(如文字、音频、视频、图画等)。
在研究问题方面,质性研究多尝试通过提出并回答以“如何(how)”“为何(why)”开头的研究问题,寻找研究对象在特定时空环境中被赋予的意义,或者剖析研究对象得以在某一社会中出现的机制或其背后的因果性联系。量化研究则多尝试通过回答以“什么(what)”或“如何(how)”开头的研究问题,发现研究对象(如自变量和因变量)之间的相关性联系以及因果性联系。同时,量化研究中提出研究假设的步骤也很少在质性研究中使用。
当然,2种研究在最终得出的研究结果方面也存在直观差异。质性研究对研究结果的论述多尝试通过阐释数据收集对象(如受访者)的意义建构或剖析具体时空环境下的因果关系来呈现一种具有典型性的社会现象及其背后的意涵或机制 。量化研究则往往尝试通过比对数据分析结果与研究假设之间的关系来寻找一般性社会规律。
2
操作性差异
操作性差异意指那些虽然难以在研究报告中读到却真实发生的、在研究行为方面的差异,如质性研究与量化研究在数据分析方面的差异。这一概念对应的是分层本体论中的“实际层(the actual)”社会实在,即那些虽然可能无法被行为者直接体验到却发生了的社会事件。
量化研究的数据分析主要是对数字型数据的计算(如t检验、方差分析或回归分析)。现在这个过程多由SPSS等电脑软件“代工”,很少还有研究者会在这一过程中按动计算器(遑论拨动算盘)。质性研究的数据分析过程则充满了反复阅读文本、比较与理解意义、归纳或验证机制等内容。虽然现在有了一些质性数据“分析”软件,但它们最大的贡献多是使研究者可以给数据贴上更多的编码标签,或者迅速找到符合特定条件的已编码数据,但质性研究者亲力亲为地阅读和分析数据的过程并未改变。
读者虽然很难在研究报告中详细读到这种操作性的差异,但我们发现这种差异不仅存在于研究过程之中,而且也会使研究者步入陷阱,以至于对自己的研究做出有待商榷的论述。例如,曾有研究者将“研究背景”中引述政策文本的内容称为质性研究部分,或将“研究缘起”中复述自己如何经由生活遭遇产生研究思路称为质性研究部分,但由于这些描述性的文字并未经过研究者对质性材料的系统性分析,因此很难将这些内容称为一种“研究”。又如,现在常见于社会科学领域的“内容分析(content analysis)”,也因其忽略文本在特定语境下的本义、引申义和比喻义的联系,而以“计数”的方法来分析文本内容,被批评是一种“对质性数据(无论是档案、文字还是访谈内容)的量化分析方法” ,而非一种质性研究方法。上述这2种情况之所以出现,正是因为研究者忽略了质性研究与量化研究间的本质性差异。
3
本质性差异
本质性差异意指研究者对研究对象本质的不同认知——不同研究在本体论层面的差异。换言之,质性研究与量化研究的本质区别在于,在研究者看来研究对象的社会性在多大程度上依赖于人的认知。这一概念对应分层本体论中“真实层(the real)”的社会实在——难以被直接观察到的“社会‘运行机制(mechanism)’”。
本体论差异一词可能过于抽象,我们可以尝试想象一个题为“可持续发展理念对奥运场馆建设的影响”的研究课题来对此进行解释。如果研究者认为“可持续发展理念”是一种独立于人的解读而存在的结构性元素,那么就很可能会依照量化的思路,循着如下步骤进行研究:①寻找场馆建设工作中可能与可持续发展理念有关的领域;②邀请相关人员给这些领域与可持续发展理念的关系打分;③通过计算发现这些领域与可持续发展理念的相关关系;④总结可持续发展理念对奥运场馆建设不同领域的影响。
与此相对,如果研究者认为直接影响奥运场馆建设的并不是“可持续发展理念”本身,而是奥组委、设计师、承包商等奥运场馆建设利益相关方对“可持续发展理念”的解读,而且这些解读里面还包括了他们对自身资源与利益的计算,那么就可能会依照质性研究的思路,循着如下步骤进行探索:①辨识奥运场馆建设各个利益相关方,设定受访者效标;②通过观察与访谈了解利益相关方如何理解可持续发展理念;③分析利益相关方如何建构资源、利益和可持续发展间的关系;④诠释利益相关方解读与奥运场馆建设之间的因果机制。
由此不难看出,2类研究者基于各自对“可持续发展理念是否依赖于人的认知存在”这一“本体论”话题的认知,设计了2种完全不同的研究路径。这也例证了研究的“本体论”对“认识论”“方法论”(以及更细的“具体方法”)的影响。
研究者在“本体论” “认识论”乃至“方法论”层面的基本认知(或者说研究的根本立场)被托马斯·库恩称为“范式(paradigm)”。如果我们将不同研究范式以本体论为标准排列成一条光谱,光谱的一端是坚持社会独立于人的认知而存在的“实证主义(positivism)”,另一端是认为社会的本质是行为者之间的互动、关系和认知的“建构主义(constructivism)”,中间则是各式各样的“骑墙派”。如果研究者认为研究对象独立于行为者(一般指研究者和数据收集对象)而存在,行为者有关研究对象的认知是研究对象对他(或她)的影响的反映,那么就会倾向于用指标和数字测量这种反映,进而得到与研究对象有关的知识。如果研究者认为研究对象依赖于行为者的认知,行为者对研究对象的理解决定了研究对象(如可持续发展、公平竞争、健身房服务质量)的存在(至少是社会性的存在),那么就会更倾向于通过访谈和观察了解行为者如何理解和解释研究对象,进而了解研究对象在特定时空环境中的价值与意义——研究对象如何存在。
综合以上论述,笔者认为质性研究和量化研究在直观性、操作性和本质性3个层面存在差异。直观性差异是读者们直观可见的不同之处,也是2种研究本质差异的外在显现。操作性差异是判断质性或量化研究的直接标准,即以哪一种视角分析数据。本质性差异不仅导致了上述2种差异,而且也是社会科学研究者选用哪一种研究方法的根本原因。当然,这种“选用”的烦恼是自然科学研究者无须担心的,因为自然的(或者说物理的)存在“独立”于人之外,而社会的“存在”不(必)然。这也体现了自然科学与社会科学的研究对象在“存在(being)”——“客观现实”与 “(至少在一定程度上的)主观现实” ——方面的本质差别。
体育学质性研究中的四重误区
伴随着我国体育学研究的日益丰富与多元,各类质性研究逐渐崭露头角。如何确保质性研究的合理性、规范性和适用性,成为众多学生与学者面临的一个重要方法论挑战。笔者从如下4个方面对体育学质性研究中目前存在的突出问题或误区进行初步讨论。
1
认识层面的误区
1.1 “质性”与“定性”的混用
在讲授科研方法的课程时,笔者要求学生搜集质性研究与量化研究的论文,并进行交流分享。结果学生们能精确地挑选并分享量化研究的学术论文,而对于质性研究论文,搜集到的种类繁多。许多学生找到的质性研究论文实际上是纯粹的论证性文章,缺乏研究过程与一手经验资料,属于思辨性论述,部分为综述性质论文。他们误认为未包含统计数据或数字的论文即为质性研究论文,这反映出在认知层面上对质性研究的误解。
质性研究是建立在逻辑经验的(logical-emprical)基础上的,符合托马斯·库恩所界定的科学范式。质性研究要求研究者亲自深入实地开展调查研究,强调将研究者实地收集的资料作为必不可少的证据来源,这是对经验/资料收集过程的基本要求。然而,质性研究并非仅限于经验收集与整理,它还涉及逻辑推理与分析过程。研究者需通过一定的手段解释、归纳、批判现实经验/现象等,并在一定的基本原则指导下,遵循一定的规范。因此,质性研究应包含2个要素:经验资料与分析逻辑。评估一项质性研究一方面须关注其提供的一手资料是否鲜活、丰富且独具特色,另一方面须审视对这些资料的归纳、诠释、解读及批判性思考是否具备学理贡献。
在各类学术期刊中时常会见到一种以思辨方式对研究现象进行诠释的文章,这类文章并不要求研究者提供一手的研究过程与资料,即只有logical 没有empirical,仅包含逻辑推理而缺乏一手经验资料的支撑。一些学者将其称为定性研究,有些也被叫作理论研究或思辨研究,还有些被叫作论证型的综述研究。在陈向明的《质的研究方法与社会科学研究》和笔者的《体育人文社会学质性研究方法及应用》中都将这类研究概括地称为定性研究,以与需要经验和研究过程的质性研究进行区分。
1.2 “实证”一词的泛化
在认识层面的另一个常见误区是关于“实证研究”这个概念的混淆和误用。不少学生将其论文分为“理论研究”和“实证研究”两部分。然而,所谓的实证研究部分的设计往往采用的是解释主义(interpretativism)范式下的深度访谈、参与式观察、个案研究等传统的质性研究方法,所以就产生了认识论与方法论之间的割裂。学生们通常认为实证是实际论据的验证(evidence-based)。然而,在严格意义上,实证研究是基于实证主义(positivism)的,以量化研究思路和客观主义立场为核心的研究范式。“evidence-based”即有实际证据验证或支持的不一定都是属于实证主义范式(positivist paradigm)下的研究,解释主义研究也需要真实发生的证据/经验(evidence/empirical data)。一些学者将这类需要实际证据/资料的研究视为“实征研究”(empirical research,以实际经验为特征基础)。虽然只有一字之差,其内涵却有相当大的差异。
2
研究设计层面的误区
2.1 对资料收集方法与分析方法的作用认识不清
在大多数情况下,质性研究的数据收集方式主要包括3类:询问(访谈)、观察以及文档查阅。有些学者误认为,只要采用了这些数据收集方法,就可以称之为质性研究。然而,事实上,量化研究同样包括询问、观察和文档查阅,因此,区分质性研究和量化研究的关键不在于数据收集方式,而在于数据分析和呈现的方法。
相应地,在质性研究之下还包括不同类型的质性研究(范式),如民族志研究、现象学研究、扎根理论、主题研究、叙事研究/生活故事、案例研究、批判研究(如话语分析)。这些研究(范式)之间的区别并不在于资料收集方法,而在于对资料的要求(询问/观察/查阅的内容、深度及广度)、分析方法以及研究结果的撰写方式各异。当然,这些差异也与研究目的和研究对象有关。例如:民族志研究要求对人群及其与环境互动的详尽描绘和阐释;现象学研究强调对日常生活(生活世界)中普通意识体验的细致描述,对每一描述进行印象派解读,以获得整体感知;扎根理论侧重理论与实践之间的互动,目标是整合概念、生成理论;主题研究的目的是识别、分析并报告数据中的主题,侧重于描述,未必追求理论构建。对于不同范式下的具体质性研究,衡量标准也各不相同。因此,不能用一种研究范式下的标准去判断另一种研究的质量。例如,用话语分析的批判性来判断主题分析的“深浅”,用主题研究的识别和归纳思维来要求民族志研究的语言精练,或用扎根理论的目标来要求所有质性研究都必须“生成理论”。
2.2 质性研究不同分析方法(研究范式)的混淆和误用
作为研究者,必须先弄清楚自己具体要进行什么类型(范式)的质性研究。目前存在的问题是想做的和实际上做的不一样。例如,很多学生在论文的前面写要用扎根理论,实际上就是做了不同层级的编码,表达方式是主题研究式的经验的主题识别、描述和阐释。还有一些宣称用话语分析进行研究,但整篇论文不做话语分析,而是将这些“引语”(quotation)作为验证自己理论假设的论据,而不去批判地分析这个话语产生的背景、语境和涵义。将访谈资料作为证据(evidence),愿意相信被访者所说就是真的,将这些“真的”经验、经历作为一种分析依据,更符合叙事研究、主题研究、扎根理论等质性研究传统。总之,不管做什么类型的研究,先要系统学习这种研究范式,了解这种研究的基本原则、过程和要求。
3
逻辑推理层面的误区
通常,量化研究进行演绎逻辑推理,质性研究进行归纳逻辑推理。然而,质性研究的逻辑推理并非仅限于简单的归纳法。事实上,其起点是归纳法,但在分析过程中会涉及演绎过程。尤其是在阐释日常经验与理论之间的关联,或将在理论框架应用于解释参与者经验时,演绎过程得以体现。举一个例子:
研究目的:了解是什么过程构成了游泳运动员的急性文化适应(Acute Cultural Adaption, ACA)(这是一个归纳逻辑),游泳者的这种ACA经验是否可以通过基于自我决定理论(Self-Determination Theory, SDT)的心理需求来进行理解(这是一个演绎逻辑)。
施万特(Schwandt)指出,质性研究中的分析通常涉及所有形式的推理,包括归纳(inductive)、演绎(deductive)和溯因推理(abductive reasoning)。abductive reasoning 又被译为推测性推理,是从一个观察或一组观察开始,然后寻找最简单和最可能的解释。溯因推理则是在已知的信息不足以进行演绎或归纳推理时使用的一种推理方法。它通常发生在探索性研究中,研究者试图构建一个假设来解释观察到的现象,即使这个假设可能不是唯一可能的或最终的解释。这个过程与归纳和演绎推理不同,并不保证得出正确的结论,但它可以生成随后可进行检验的假设。因此,有些学者也认为“溯因”在链接归纳与演绎上起到了关键作用,也建立起了质性研究与量化研究对话的桥梁。
4
操作层面的误区
4.1 质性研究的“代表性”问题
质性研究到底需不需要像量化研究一样强调代表性?回答这个问题,先要理解质性研究与量化研究对概括性(generalizability)和可移植性/转移性(transferability)的不同考虑。
量化研究试图将研究结果推广到更大的人群中,并基于统计推断进行预测,称为统计推广性、统计普适性(statistical generalizability),或可理解为对外代表。统计推广性依赖于样本的代表性和足够的样本量以推断整个人群。
质性研究采用的是自然概括性(naturalistic generalizability),或可理解为对内代表(internal generalizability),即结论能不能全面、深入地反映这项特定研究所选特定人群/案例/参与者的所有情况。这意味着研究结果的可信度和适用性更多地依赖于研究的深度和背景情境的详细描述,以便读者可以判断这些发现在多大程度上适用于其他类似情境,这就涉及另外一个重要概念,即可转移性。
可转移性是指研究结果在不同情境或群体中的适用性,是对概括性概念的一种质性研究视角。可转移性关注的是研究发现是否可以被读者转移到其他相似情境中,而不是简单地将结果普遍适用到所有情境。这与量化研究中的“泛化性”或“推广性”略有不同,后者侧重于统计上的代表性和更广泛的适用范围。简单而言,一项质性研究的可转移性指读者能够把从研究中得出的发现和理解应用到自己的实际经验中,即研究结论是否可以与读者的实际生活联系起来,或者读者能否从中找到一些对自己有用的东西。所以,与量化研究的推广性不同,质性研究的可转移性不依赖于样本量的大小,而取决于研究参与者的经验是否能够在最大程度上反映一种社会事实。
4.2 质性研究的样本问题
根据研究范式的不同,样本量的体现亦有所差异。许多质性研究者认为,单一样本是可行的,如自我民族志和案例研究等。同时,较大的样本量亦存在可能,如扎根理论和主题研究可能涉及上百个样本。总体而言,质性研究并未对样本量进行严格规定,但对样本质量有一定要求,衡量标准主要体现在饱和度(saturation)和丰富性(richness)上。然而,进行扎根理论研究时也须关注量的层面,以确保饱和度的达成。
在质性研究中,抽样原则通常遵循目的抽样,而非随机抽样。在确定样本时,应根据研究问题及目标受众设定抽样标准(仅为标准抽样方法之一)。具体的抽样策略包括雪球抽样、理论抽样、最大变异抽样等多种方式。
4.3 关于研究者在场的问题
某些质性研究,如民族志研究,强调在场(being there)的重要性。这种在场并非仅限于在场观察,而是要求研究者深入参与,以获取局内人(insider)的视角与经验。尽管部分论文在研究设计中提及采用参与式观察,但实际上仅停留在作为旁观者的考察层面。例如,一篇以参与式观察法研究某村舞龙活动的论文,研究者并未真正融入舞龙活动,而仅限于现场观察、询问或短暂走访村庄。此类观察方式并未满足在场的要求,仅能视为一般实地调查。参与式观察要求研究者作为成员参与其中,并在一定时间内获得参与者的内部经验,从参与者视角对体育活动或现象进行理解和阐释。
然而,并非所有质性研究都要求研究者进行参与式观察或从局内人的角度收集和分析数据。一些质性研究,如现象学、叙事研究、主题研究和扎根理论等,并不一定需要研究者成为局内人。对于作为局外人(outsider)的研究者而言,如何理解和解读被观察和访谈者的经验,涉及研究者角色和定位的问题。确定研究者角色通常需要建立在反思性立场(reflexivity)的基础上。一项高质量的质性研究应包含反身性思考的陈述,这里并非追求简单的是非问题,而是要明确告知读者,研究者在各项研究中的角色及其对研究的影响。质性研究的这种反思性正是其对待研究结论的客观性反映,即承认社会科学研究是有价值取向的。
总之,质性研究旨在深入理解人类行为和社会现象的复杂性。它强调主观经验、社会构建的现实以及研究者与研究对象之间的互动。从本体论到认识论再到方法论,质性研究要求研究者全面系统地理解和应用其理论基础和方法工具,以确保研究的深度和质量。在使用或评估具体质性研究时,需要考虑其设计、执行和分析的整体性,以及如何在特定的研究背景中应用其发现。
体育学量化研究亟待“思想转向”
1
体育学量化研究能力有待提升
最近20年,我国的体育学研究取得了长足进步,逐渐从思辨式的讨论转向量化式验证。伴随着量化技术的日渐成熟,一些学者逐渐表现出对方法技术的依附,将量化等同于研究,将计算公式等同于科学推理,将量化技术误认为是一切科学方法论的基础。在研究中,我们时常看到“用复杂方法验证常识问题”和“结论域大于问题域”等现象。这一方面源于理论框架和概念之间缺乏紧密关联,另一方面则反映出对真实世界不够关切,对研究问题和因果机制的解释缺乏根基。对量化技术的应用有余,而对理论贡献和学术价值的把握不足,已成为部分体育学量化研究不断被质疑和否定的根源。
每年体育类期刊刊登大量量化研究的论文,希望通过数据和模型让研究看起来更“科学”,但相关内容并未得到政界、业界等应有的关注,尤其在面临亟待解决的实际问题时,几乎很难在数字堆砌的文字中找到应对策略。是做量化研究不好、不对,还是我们做量化研究的能力有待提升?笔者认为应该是后者。做自然科学研究要求科学性、客观性和普适性,但体育行为本身带有主体性、主观性和独特性。这就决定了在体育学研究中除了生理生化、生物力学等自然科学研究外,只要与体育行为相关的内容就不能强调绝对的量化,因为体育行为的主体是人而非技术,只有人才能在海量数据中读懂体育,解读体育行为变化的规律、体育发展的底层逻辑以及体育运作的规律等。学者做量化研究如同教练员指导比赛,懂量化技术仅仅是知道在什么比赛中该用什么技战术,但技战术布局是否合理有效,必须在比赛中才能见分晓。这意味着只学会了量化技术并不代表真正懂得如何搞好体育研究,更不能仅凭几个模型结果就盲目地“指点江山”,因为除了科学性之外,体育学研究还要关注“现实性”,在假设-验证之间我们很难穷尽地验证“现实”,要想读懂体育的“现实性”还需要大量的实践。因此,笔者强调体育学量化研究的能力有待提升,并非倡导再多学几种量化技术,而是要避免形式化的量化路径依赖,在做量化研究的同时,要走出去看社会、提问题、想策略,将二者结合才能做出更接地气、更有价值、更有思想的研究。
2
对体育学研究中“量化至上”倾向的反思
体育学量化研究中数学模型的“虚假繁荣”反映出一个令人深思的问题,体育学研究不应被数学公式所约束,进而“为定量而定量”,而应发现体育问题、解释体育现象、证明体育规律。体育学量化研究中重验证、轻思考的“技术至上”取向导致“方法主义”困境,这一实用性倾向的背后使得机械套用量化方法、理论底蕴不足、学科格局陷入公式崇拜、方法有余而方法论不足等问题频现。经验研究发展迅速与理论研究发展缓慢形成了鲜明的反差,研究范式也逐渐割裂并分化为纯碎的思辨与绝对的实证2种看似“水火不相容”的形式。其结果不仅在理论创新上严重不足,实证研究的结果也是看似华丽前沿,实质上却严重脱离实际,无法触及真实的中国体育问题,甚至会对解决体育现实问题产生误导。
体育学研究需要借鉴以量化研究为主体的科学范式,但量化研究数量的多少不能作为衡量学科繁荣与否的标准。体育学研究的真正价值在于践行实践自觉,在实践中不断考查和回应那些由思想衍生的价值思考和不易厘清的科学问题与判断。这是因为体育学这门学科自诞生之初便与体育实践密不可分,它应西方现代体育转型而起,在中国同样根植于体育发展进程。作为一门重要的学科,体育学的使命是回答中国式现代化进程中的体育实践问题,无论量化研究还是质性研究,都是学术发展道路上实践的工具。
因此,体育学研究不应停留于“公式崇拜”层面,要立足中国体育改革发展的实际,注重对实践经验的解读,不断提炼理论性命题,找出推动体育发展的出路。立足实践要求,在研究中要时刻“三省吾身”,对所用的理论和方法有“自知之明”,不能沉溺于用西方理论视角来解读中国体育问题,不能习惯于以某个单一的理论脉络去寻找解决中国体育问题的答案,不能困囿于追赶日新月异的新话语和新方法,而忽略了学者自身的主体性、反思性和实践性。
3
体育学量化研究的逻辑起点:思想与方法的平衡
做好量化研究的前提是思想和方法的结合,需要在思想和方法之间寻找一个平衡点。20世纪90年代我国体育学经历一个思想的黄金时代,一大批优秀学者作出了重要的理论贡献,一些对体育科学规律探寻的研究成果至今仍有着重要意义。遗憾的是这些理论观点虽被提出,却未能在现阶段的研究中得到继承和发展,甚至逐渐销声匿迹。在那个研究方法应用相对匮乏的年代,学者们能以清晰的分析和深邃的思想阐释体育,在方法技术蓬勃发展的今天,却难以在数学模型中去延续那些重要的思想和观点。
事实上,体育学发展至今,我们应清楚地认识到,方法本身是体育学的重要组成部分而非全部,对研究方法的重视不能独立于研究内容,更不能喧宾夺主地置于思想和观点之上。量化研究中的数字和模型,要承载特定的理论思考和学术观点,要蕴含特定文化意涵和价值需要。如果不从体育实践角度去选题、从理论建构角度去假设、从文化价值角度去解释,那体育学研究将在一定程度上被分析工具的进步、规范和严谨所束缚,难以探寻和追问隐藏在体育现象和科学规律背后的意义。体育学者的目标不仅应成为数据专家,更应成为有科学思维的思想家。
体育学的发展需要以高度客观的科学模式建构知识体系,但也要时刻保持追求学科知识本质及理论发展的初心。作为体育学者,我们要在研究中寻求思想和方法的平衡,既要用科学的方法研究问题,更要时刻保持理论反思的态度,深入理解研究论点,并不断检验和更新,只有秉持这一辩证思维,才能不断地丰富学科知识并持续提出新的理论主张。
体育学量化研究论文存在的典型问题与应对
学术研究的重要目的是提出理论、找到规律,即发现事物运动过程中内在的、固有的、本质的和必然的联系。量化研究是提出理论和找到规律的有效方法之一。近年来,我国体育领域的量化研究水平不断提高,涌现出不少高质量研究成果,但仍存在一些典型问题需要解决。
1
当前体育学量化研究论文存在的典型问题
1.1 样本数据
笔者在为部分体育学期刊审稿时发现,一些量化研究论文存在样本数据不完整、不准确、不及时等问题。例如,一些论文旨在分析我国体育产业上市公司情况,但有些体育产业上市公司并未被包括在内,同时论文中一些样本公司的主营业务也并非体育产业,如此分析结果就不能完整、真实地展示我国体育产业上市公司的相应情况。又如,一些论文旨在分析各类体育赛事举办对当地经济发展的影响,但未考虑部分年份各地行政区划调整的问题,并且使用的人口数据为户籍人口而非当地常住人口数量,这样不能准确地衡量各地经济发展水平。再如,某篇2022年投稿的论文考察2014年中超联赛比赛日PM2.5数据与中超俱乐部球员当天表现的关系。2014年至今,中国环境治理已取得了很大成绩,论文用较为陈旧的数据计算结果并据此提出建议,明显不合时宜。
1.2 指标设定
一些量化研究论文设定的指标并不能准确度量实际情况。例如,某篇论文设定了我国各省份的体育用品出口竞争力指数,其分子为“出口量−进口量”,分母为“出口量+进口量”。假设甲地某产品出口量为1,进口量为0;乙地出口量100,进口量50。此时甲地贸易竞争力指数为1,乙地为0.33。仅以此数值说明甲地的竞争力大于乙地,是不科学的。又如,某篇论文旨在分析居民体育参与水平与家庭财务违约风险的关系,使用“家庭资产负债率”来衡量居民家庭财务违约风险。这并不得当,原因在于不同家庭间甚至同一家庭不同时期都是异质的。即使处于相同的资产负债率,不同家庭在相同时期或同一家庭在不同时期财务违约风险也是不同的。
1.3 计量模型
一些量化研究论文的计量模型并不可靠。例如,某论文旨在分析大型体育赛事对体育经济发展的影响,却只包括不足10年的年度数据,指标变量少于5个,样本量过少、过窄,据此计算出的结果并不可靠。又如,一些论文为了说明中国体育产业增速高于国民经济增速,衡量前者使用的是名义值,衡量后者使用的却是剔除物价上涨之后的实际值,这就夸大了体育产业相对国民经济的增速。再如,中国GDP的统计方法曾有数次调整,不考虑这一情况,单纯采用不同口径得出的年份数据来考察各项体育事业对当地经济的影响,计算出的结果可能不准确。
1.4 结果解读
一些量化研究论文对于量化结果的解读存在偏差,甚至是因果倒置。例如,某篇论文发现某支足球队连胜次数越多,下一场比赛获胜的可能性越大。作者的解释是足球比赛存在动量效应,连续的获胜或失利会对下一场比赛结果施加正向或负向影响。这一结论忽视了另一种可能,不同球队竞技水平不同,连胜场次越多,表明这支球队越可能是强队,下一场获胜的可能性自然就越大。这与动量效应并没有直接关系。又如,某篇论文发现,中国足协“U23政策”实施以后,U23球员表现的各项指标水平下降了。作者的解释是这项政策强制规定U23球员上场次数,导致这些球员队内竞争减弱,他们就会偷懒,表现水平下降。这种解释缺乏说服力,原因在于作者忽视了“幸运者偏差”。再如,某篇论文发现,某地区体育彩票销售量与当地体育事业财政支出呈高度正相关。作者的解释是体育事业财政支出提升了体育公共产品供给水平,为居民扩大体育消费直接提供了物质基础和信心基础,进而使当地居民增加体育彩票等娱乐型体育消费支出。但可能更符合现实的解释是,体育彩票是体育事业的“生命线”,体育彩票销售增长为当地体育部门提供了更多的公益资金,由此提升了体育事业财政支出。
2
应对建议
2.1 树立信心
中国体育事业在国家发展进程中飞速进步,其间蕴藏了大量亟待发掘、研究和总结的学术“富矿”。高质量论文是稀缺品,各家学术期刊都非常珍视,并希望将其率先刊发。在评审一篇高质量论文的过程中,审稿人也会从中深受启发,提出各项意见的目的是进一步提升论文的质量。因此,我们要坚信发表论文人人平等,唯一的标准就是论文的质量。样本选择得当、数据完整翔实、指标设定科学、计量方法合理就为完成一篇优秀的量化研究论文提供了坚实基础。前文提到一些论文中存在的样本数据问题,一个重要原因是目前中国体育领域的一些数据还不够完整和准确,甚至不同部门对同一项指标的统计口径都不一致,如何获得完整、准确和及时的数据成为衡量研究者核心竞争力的一项重要指标。
2.2 苦练内功
目前中国体育界待研究问题太多,选题本身不应成为问题,即最关键的不是“做什么”,而是“有没有能力做”。体育学研究者应深入研读母学科经典文献和新近成果,真正了解相关的理论和模型的前提条件和适用范围,而不是简单地机械式照搬甚至滥用。要真正了解、尊重和热爱体育,而不能凭着量化方法和工具单纯地进行“学术套利”。研究者不应将科研工作视为一种谋生手段甚至是一项负担,而应热爱甚至是“痴迷”于此。在科研工作过程中充满着百思不解的煎熬,但这些煎熬并非徒劳无功,而是一个累积过程,待机缘成熟,就注定会有“灵光乍现”的喜悦。量化研究的优势是避免主观因素干扰,得出相对客观的结果。目前已有多种相关量化研究理论和手段,研究者需要根据研究主题设定指标,选择合理的计量方法,而不应“为了量化而量化”,更不能为了使论文显得“可靠”而错误地使用或使用错误的数理分析方法。
2.3 立足现实
国际体育领域大部分量化研究基于西方发达国家情况得出结果和结论,我国研究者在具体应用时还需要针对中国特色加以适当调整。例如,欧洲足球五大联赛是跨年制,国际上关于俱乐部球员转会费统计口径与此接轨,即当年夏季加次年冬季。中国足球联赛是自然年制,考察中国足球俱乐部球员转会费的各赛季投入,就不能直接采用国际口径统计出的结果。很多中国正在发生的事是发达国家十几甚至几十年前发生过的,需要借鉴经验,但也必须意识到国外已经有的“桥”未必是最好的。中国具有五千年的悠久历史且正在中华民族伟大复兴之路上砥砺前行,我们不能简单复制已有模式,而是要进一步发展必须要造好中国人自己的且可被其他国家发展借鉴的“桥”。
中国体育事业的实践者普遍乐于向研究者分享其经验,也希望得到理论指引以实现进一步发展。体育研究者应与实践者进行深入和广泛的交流、互动与合作,不能闭门造车。一项出色的量化研究成果应是在深入了解体育实践和理论的基础上,以某项代表性事例为对象,经过严苛稳健性检验,总结出普遍性规律,并能够提出指引该领域未来发展的切实可行的建议。
2.4 坚持操守
源于多种因素,当下的研究人员尤其是中青年研究人员面临较大的科研考核压力,但无论基于何种理由,必须坚守基本的学术道德底线。笔者建议,如果发现自己的论文存在较为严重的问题且还没想好解决方案就不要投稿。如果“问题论文”在某些期刊被侥幸发表,不仅很可能被他人发现,甚至还可能会对相关政策产生一定的误导。中国社会一直在进步,越来越多的人都意识到了“工匠精神”的重要性。当大多数人去争“捕鼠”权力的时候,最后真正并且唯一能够带来超额回报的是最好的“捕鼠器”而不是“捕鼠”的垄断权。笔者相信,基于中国人的勤劳和智慧,中国“桥”必然会越来越多、越来越好。
3
结束语
量化研究只是找出规律的方法之一,自身也有不足。目前,一些学科领域的确存在学术研究和论文写作中的过度数学化、模型化等不良倾向,但前提是相关研究者已经普遍“掌握”量化研究方法。基于中国体育学界的实际情况,量化研究方法还需要得到进一步推广和应用。需要警惕的是,一些人反对量化研究的真实原因不是反对这一方法的滥用,而只是为了掩饰自身在此方面的缺陷。
我国体育社会科学研究中方法应用的科学性审思
随着科学研究方法及数据科技的进步,体育社会科学领域经历了前所未有的变革,特别是实证定量研究方法(如一般线性回归、Logistic回归和计数回归模型)已成为体育社会科学研究中的关键工具。学者应用这些方法不仅能够揭示变量间的相互作用,增强对社会现象的理解,还能深入探索体育参与与社会经济因素之间的互动关系。然而,随着这些方法的广泛应用,如何确保方法应用的科学性和研究结果的有效性成为重要议题。本文旨在审视中国体育社会科学研究中方法应用的科学性,探讨其现状、面临的挑战以及未来的发展方向。
1
体育社会科学研究方法应用科学性存在的问题
1.1 理论基础不足,研究设计存在缺陷
理论基础的重要性在体育社会科学研究中常被低估。高质量的研究应建立在坚实的理论(不仅指西方社会科学的理论,还包括根植于中国特色的体育学理论)基础之上。在当前体育社会科学研究中,很多研究科学问题不明确,且缺乏理论分析和支撑。在这种情况下研究往往缺乏问题意识,难以对领域内的现有知识体系作出贡献。例如,部分论文在分析体育参与对社会的影响时,未能充分基于社会学、经济学等相关理论,导致研究结果缺乏说服力。体育社会科学研究中的研究设计不仅涉及研究问题的选择和理论框架的建立,还包括研究方法的选择、样本的确定、数据的收集和分析过程。在很多研究中,由于缺乏科学严谨的研究设计,结果难以准确反映实际情况,甚至得出误导性结论。
1.2 对模型稳健性检验和数据质量重视不够
体育社会科学研究中对于模型稳健性的检验和异质性分析的关注度不够。高质量研究应检查模型的假设条件是否得到满足、数据是否具有代表性和稳健性,以及是否存在可能影响研究结果的异质性因素。在部分体育社会科学研究中,这些关键步骤往往被忽略,导致研究结果的可信度和有效性受到质疑。此外,体育社会科学研究中还存在对数据质量及处理的忽视。在研究中存在忽视原始数据中的异常值、缺失值等问题,对于数据清理和预处理不当会对模型的结果和结论产生重大影响,从而导致错误的推论。研究者有时基于预设立场有选择地纳入或排除某些变量,这种选择偏误可能会导致统计结果的不准确,进而影响研究结论的可靠性。
1.3 统计模型选择存在问题
体育社会科学的研究往往侧重于应用统计模型进行分析,较少涉及模型内部运行机制的科学探讨,导致对研究结果的解释局限于表面。例如,一些研究可能仅基于模型结果提出结论,却未能充分解释模型内部的假设条件和运行机制,这降低了研究结果的说服力和可重复性。模型选择的偏误是体育学量化研究中的常见问题。在选择和应用统计模型时,不能充分考虑理论与数据的匹配性,导致模型结果的偏误。不同的统计模型基于不同的假设,例如,线性回归模型通常假设变量间不存在多重共线性,且残差应遵循正态分布原则。在研究中,这些假设条件往往被忽视或误解,导致模型结果失效。在获得分析结果后,假如未能对模型内部的运行机制和假设进行充分解释,就会降低研究结果的说服力和可复现性。因此,必须对所使用的模型有深入理解,确保结果适合于特定的研究问题和数据。此外,必须谨慎解释模型结果,避免将相关关系误解为因果关系。
2
提升体育社会科学研究方法应用科学性的策略
2.1 夯实理论基础,提升数据质量
为了克服体育社会科学研究中存在的以上问题,增强问题意识导向及中国体育社会科学理论创新是提升研究质量的首要步骤。这要求学者们在研究开始之前进行深入的实地调研、文献梳理和理论分析,确保研究问题的提出有理论支撑,还应对已有理论进行创新和发展,将新的理论观点应用到体育社会科学研究中。在调查数据收集阶段,应采取科学的抽样方法,确保样本的代表性;更需要注意数据收集过程中的偏差,如避免调查问卷设计中的引导性问题,确保数据的客观性和真实性。在数据清理时需要识别和处理异常值,填补或正确处理缺失数据,谨慎选择数据转换和标准化的方法,以避免对研究结果产生负面影响。
2.2 利用数据可视化和因果图增强结果的理解力
研究结果的数据可视化有助于读者直观地理解数据和研究结果。相比传统的表格展示,借助AI的数据可视化工具表达研究结果更能吸引并维持读者的注意力,提升研究成果的影响力。例如,多维度、多变量的交互可视化图形不仅可以更清晰、简洁地展示复杂的变量关系(如变量间的相关性、分布特征和趋势变化、数据的统计属性),还能揭示数据中潜在的因果关系。同时,因果图方法为研究者提供了一种新的、非参数的因果关系表达形式。相较于传统的统计模型,因果图以直观的图形形式呈现变量之间的因果关系及可能的干扰因素,使得复杂的因果结构更易于被普通读者理解。如通过因果图表达的链状、叉状、反叉状构型,有效阐释变量间的直接和间接影响。体育社会科学研究者应适当采用因果图来可视化因果假设、变量选择依据等,以提升研究透明度。
2.3 发挥因果推断方法的革新作用
随着计算机技术、研究方法的不断进步,体育社会科学研究将显著依赖于方法论的发展。因果推断方法的应用及多层次、多维度因果关系分析的重要性日益凸显。例如,双重差分、工具变量法、断点回归分析和处理效应等方法可帮助研究者在观测数据中更好地估计因果关系。这些方法的应用对于解答体育活动如何影响个体行为和社会变迁等复杂问题至关重要。例如,通过调查实验方法可更准确地评估政策对人们体育参与的影响。然而,应用这些统计分析方法时面临诸多挑战(如数据处理和方法的复杂性),要求研究者不仅要具备跨学科的知识背景,还需要有深厚的统计能力、体育学理论知识与实践经验。
2.4 推动跨学科研究方法的融合
随着数据科学的迅速发展,机器学习、社会网络分析和文本挖掘等方法将在体育社会科学研究中扮演越来越重要的角色。例如,机器学习方法可实现从关联、因果走向预测,拓展体育社会科学研究范式。社会网络分析可揭示体育团队间的互动和合作模式,帮助理解团队行动和个人竞技表现。文本挖掘方法则可分析体育传播和社交媒体中的公众情绪和观点,为公共体育服务、体育赛事发展策略研究提供依据。在研究中融合上述方法不仅可以处理大量复杂的数据,还能提供新的视角和方向,从而提高研究效率和准确性,拓展体育社会科学的研究视野,由此启发理论假说、助力因果推断、实现数据增生、推动理论创新。
本文刊于《上海体育大学学报》2024年第4期。为方便阅读,此处删去原文注释,如果其他媒体或机构转载,请标明文章出处。
上海体育大学学报长按扫码关注我们