《保健食品原料保健功能声称科学证据 评价技术指南》团体标准发布
ICS 67.040 CCS X04
团 体 标 准
T/CNSS 031—2024
保健食品原料保健功能声称科学证据评价技术指南
2024 - 12 - 16 发布 2024 - 12 - 16 实施
中国营养学会 发布
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国营养学会营养与保健食品分会联合其他单位提出。
本文件由中国营养学会归口。
本文件起草单位:中国营养学会营养与保健食品分会、中国疾病预防控制中心营养与健康所、国家市场监督管理总局食品审评中心、国家食品安全风险评估中心、东南大学公共卫生学院、北京市科学技术研究院、四川大学公共卫生学院、河南省疾病预防控制中心、兰州大学公共卫生学院、首都医科大学公共卫生学院、北京大学公共卫生学院、华中科技大学公共卫生学院、苏州大学公共卫生学院、纽崔莱营养与健康研究中心、中营惠营养健康研究院、汤臣倍健股份有限公司、北京邦尼营策科技有限公司。
本文件主要起草人:杨月欣、孙桂菊、朱婧、杨晓光、张立实、王竹、刘洪宇、陈广耀、周瑾、张丁、王玉、张兰兰、丁钢强、李宁、张玲、何宇纳、王瑛瑶、方海琴、潘安、秦立强、黄涛、马姗婕、罗蓉、贺瑞坤、孙利娜、陈希民。
引 言
《中华人民共和国食品安全法》、《保健食品注册与备案管理办法》(国家食品药品监督管理总局令第22号)、《保健食品原料目录与保健功能目录管理办法》(国家市场监督管理总局令第13号)、《保健食品新功能及产品技术评价实施细则(试行)》(国家市场监督总局公告〔2023〕37号)等法律、办法、细则等文件对保健功能评价工作提出一系列要求。
本文件主要围绕保健食品原料与保健功能关系的科学证据评价,参考借鉴GRADE国际有益做法和经验,及中国营养学会《食物与健康:科学证据共识》建立的营养证据评价方法,重点明晰了证据评价基本原则、文献收集方法、评价程序以及证据强度、推荐建议等内容,旨在引导和推动相关主体规范保健功能的证据评价,持续推动保健功能证据评价工作的标准化、规范化、科学化,更好地服务保健食品原料目录和保健食品功能目录的创新和管理。
保健食品原料保健功能声称科学证据评价技术指南
1. 范围
本文件规定了保健食品原料与保健功能关系科学证据评价的基本原则、文献收集方法、评价程序、 证据等级以及推荐建议;规定了证据报告的方法和格式要求。
本文件适用于拟纳入或者申报保健食品单一原料/功能备案目录的资料评估,包括建议增加和调整保健食品原料目录的资料评估;也适用于保健食品新功能审评中主要功能物质所需科学证据材料的编写参考;以及健康相关指南/科学共识类研究应用的参考。
2. 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 7714 信息与文献 参考文献著录规则
3. 术语和定义
下列术语和定义适用于本文件。
3.1
保健食品
按照《中华人民共和国食品安全法》,不会对人体产生急性、亚急性或者慢性危害的具有保健功能的特殊食品。
3.2
保健功能声称
按照《保健食品新功能及产品技术评价实施细则(试行)》,保健功能包括补充膳食营养物质、维持或改善机体健康状况、降低疾病发生风险因素三类,对保健食品所具备功能的规范性说明。
3.3
保健食品原料
可用于保健食品并发挥功能作用的物质,包括但不限于维生素、矿物质、其他膳食成分或活性成分、新食品原料、按照传统既是食品又是中药材的物质、可用于保健食品的物品名单等。
3.4
研究文献
在国内核心学术期刊、国际学术期刊正式发表的学术论文。
3.5
循证营养学
围绕问题或假设,全面、系统地收集评价当前最新最佳的研究证据,对食物及营养物质与功能等做出系统性评价,并进一步结合利弊平衡、资源等给出实用性的决策建议。
注:即制定和实施有科学依据的评估-决策的过程。
3.6
文献质量评价
根据循证营养学标准化的方法,针对要论证的问题,开展系统检索,对收集的原始研究文献经严格筛选后,对单个文献的研究设计、实施情况等维度进行的质量评述。
3.7
证据体
依据标准化方法,开展系统检索和严格筛选后形成的由多种研究和来源的所有纳入文献、原始文献、资料的集合。
3.8
证据强度
对经严格筛选后符合要求的所有纳入文献(证据体)进行综合分析,评估得出保健食品原料与保健功能声称关系的证据充足性、共识性和可信程度。
3.9
证据综合评价
围绕保健食品原料与保健功能声称关系,全面、系统地收集和筛选所有符合要求的相关文献,通过文献质量和证据体评价,得出证据强度的全过程,并结合专业理论知识和实践完成证据评价报告、推荐建议和报告。
4. 基本原则和评价原则
4.1 研究文献
优先采用设计严谨、高质量的人群研究文献(证据体)。动物和体外研究文献仅可用于帮助生成研究假设和机制阐释的背景信息。申请人掌握的未发表研究文献仅作为参考资料。纳入证据综合评价的研究文献和人群数量应充分。当研究文献数量不足时,终止证据综合评价。
4.2 评价人员
- 4.2.1 证据综合评价需由有资格的专业评价人员完成,不接受申请人自己完成的证据评价报告。
- 4.2.2 评价人员负责循证和报告出具的全过程,具有较高的专业素质,作风严谨,坚持原则和职业道德;具有医学或营养学等相关专业背景及副高级以上职称,对 GRADE 方法、循证营养学和本文件的所有内容有深入理解,包括文献质量和证据强度等级评价的方法、标准和流程。需要持续学习最新的GRADE 证据评价指南和方法学进展;并定期参与培训和认证。
证据综合评价由至少 2 名有资格评价人员独立完成,并按照评价程序执行。遇到分歧时需讨论并达
成共识,或者由第 3 名有资格的评价人员进行裁决。
- 4.2.3 证据报告评审工作组不少于 5 人,负责证据报告审核和推荐意见。工作组成员宜具备多学科背景,由营养学专家、流行病学专家、医学、卫生决策或卫生管理人员等组成,对完成的证据评价报告进行评审。
4.3不同类型保健功能的评价原则
4.3.1 补充膳食营养物质声称:此类声称原则上不需要进行第 5 章所示的证据评价程序。但需要提供关于人体健康“必需性”或“必要性”的文献资料证据,特别是精准化目标人群的需求和目标人群摄入量现状等。资料来源包括但不限于权威教科书、经典文献或著作等关于“必需性、必要性、安全性”资料。申请人需自行判断文献和书籍的“权威、可靠”。
4.3.2 维持或改善机体健康状况声称:此类声称需按照第 5 章所示的证据评价程序,进行文献质量评价、得出证据强度等级的全过程。
4.2.3 降低疾病发生风险因素声称:此类声称需按照第 5 章所示的证据评价程序,进行文献质量评价、得出证据强度等级的全过程。
4.2.4 以传统养生保健理论为指导的保健功能:此类声称原则上不需要进行第 5 章所示的证据评价程序,但单一原料或主要功能的功能评估应该主要参考食用历史和《中华人民共和国药典》所述功能。
4.4 资料公开
证据评价报告及相关资料发布在相关网站供公众查询和评价。
5. 证据评价程序
5.1 概述
以下适用于维持或改善机体健康状况和降低疾病发生风险因素两类保健功能的证据评价。证据评价报告需由有资格的专业人员完成,并按照以下程序进行。
5.2 提出科学问题
5.2.1 其他认为需要明确的问题。
5.2.2 明确结局指标,包括主要结局指标、次要结局指标,指标判断方法等。
5.2.3 明确对照人群,如无暴露或健康结局不同的人群,或采用安慰剂、不同干预剂量的人群等。
5.2.4 明确干预或暴露措施或方式,如摄入的原料或物质的名称、来源、主要成分等。
5.2.5 明确该功能的适用人群,包括年龄、生理状态、环境区域等。
5.2.6 根据申请人的要求和目的,提出某种原料与某种保健功能关系的假设和相关科学问题,明确工作目标和检索要求。
5.3 明确和建立文献检索策略
根据科学问题和工作目标,证据评价人员与申请人共同确定检索关键词、纳入/排除标准等。特别是明确PICOS,即适用人群(population, P)、干预(或暴露)措施(intervention, I)、对照人群(comparison, C)、结局指标(outcome, O)和研究设计(study design, S)。
5.4 实施文献检索和筛选
5.4.1 确定中英文检索关键词和检索式。
5.4.2 至少在以下数据库进行检索:中国知网,万方数据库,中国生物医学文献数据库,PubMed,Web of Science,Cochrane Library,Embase 数据库和临床试验注册数据库。
5.4.3 明确纳入/排除标准,筛选符合要求的研究文献。
5.4.4 建立入选研究文献列表和全文集:以表格方式列出研究文献的具体信息,包括但不限于文献名称、发表年份、研究类型、研究方法、例数、研究对象/年龄、摄入形式、摄入量、干预/观察时长、结果、不良反应等。除此之外,还需提供符合 GB/T 7714 的参考文献列表,并附上主要文献全文。
5.5 开展证据评价
5.5.1 概述
证据评价可以分为证据质量和证据强度两方面。证据质量包括单篇原始研究、证据体总体文献质量评价。按附录A的过程进行具体评价。
5.5.2 单篇文献质量评价
首先对单篇研究文献进行文献质量评价,通过研究设计类型、实施情况、效应值、健康相关性得出单篇文献质量评价的评分。
5.5.3 证据体评价
计算所有研究文献(证据体)文献质量评分的平均得分以得到证据体总体文献质量评分,进一步根据不同研究文献的一致性、有效率、人群相似性、适用性初步得出证据强度等级,并考察是否存在表A.14 中所列出的降低或提高证据强度等级的因素。

图 1 证据评价流程图
5.5.4 证据强度等级
证据强度等级按照通用标准 GRADE 分级系统,由高到低分为 A、B、C、D 四个等级。
A 级:高级别证据,证据充足且科学共识广泛,结论为确信的证据,进一步研究可能也不会改变该证据结果的可信度。
B 级:中高级别证据,证据较充足且达成一定程度科学共识,表明在大多数情况下结论是可信的, 进一步研究可能影响该证据结果的可信度。
C 级:低级别证据,证据尚可但尚未达成一定程度共识,表明结论原则上是可信的,但应用时需注意适用范围。进一步研究极有可能影响该证据结果的可信度,且该评估结果很可能改变。
D 级:证据不足,评估结果很不确定,不能得出结论或结论不可信,使用时需非常谨慎,或不使用该结论等待更多研究。
6. 证据报告撰写
6.1 内容和格式
保健食品原料保健功能证据报告的内容、格式和要求按附录B,所用主要文献及数据统计等资料可附后。其他支持性资料如权威著作、他国权威部门的相关文件和产品标签信息等也可作为相关的补充材料。
6.2 保健功能关系推荐建议
根据证据报告,并结合其他支持材料、专业理论和经验等,证据报告审核工作组经审核和讨论,形成可用于该保健食品原料和保健功能关系的推荐建议。
维持或改善机体健康状况的保健功能声称,证据强度等级需达到C级及以上;降低疾病发生风险因素的保健功能声称,证据强度等级需达到A级或B级。
证据报告评审工作组的推荐建议需能够代表有关证据和社会因素的整体考量。检查证据质量是否经过偏倚风险的评估,如文献整体与建议功能相关,与建议适宜人群契合等,证据权重的真实性、符合科学逻辑等。
6.3 其他考虑
证据评价人员负责确保截至报告完成前证据的完整性,并对证据报告科学性、真实性、可靠性负责,需签名和签署日期后递送申请人。原则上无需加盖证据评价人员所在单位公章。
当文献报道了不良事件或反应时,报告中需如实反映。必要时说明是否存在利益冲突。
7. 其他
7.1 本文件主要针对单一原料/物质或产品的主要功能物质/食物原料。
7.2 申请人有责任追踪科学研究进展,及时更新证据评价报告(至少每 5 年进行一次),及时做出观点变更或延续。
7.3 当保健功能声称证据强度等级未达到推荐建议要求的等级时,可在 2 年及更长时间后,依据新的研究文献的丰富程度及时补充,再进行评价。
7.4 本文件仅提出原料-功能声称确定的证据评估原则、技术程序和推荐建议的技术性指导,不代表任何政府机构的最终决策。
附录 A
(规范性)
证据评价和强度判断
A.1 研究设计类型
由于研究设计本身的特点,不同类型的研究证据强度不同,在可能出现结果错误和偏倚的风险也是不同的。本标准中科学证据仅包含人群的研究文献,按照强度顺序如系统综述、荟萃分析、随机对照试验、队列研究、病例对照研究、横断面研究等。
随机对照试验(randomized controlled trial):指一种干预性研究的方法。按照随机分配原则将研究对象分为试验组与对照组,分别施予干预措施和对照措施,通过随访观察比较各组之间的结果,判断干预措施的实施效果,可给出因果关系的判断。
队列研究(cohort study):指一种论证相关关系强度较高的研究方法。通过观察一定范围人群中某种原料物质的暴露状况(如摄入频次或摄入量),随访一段时间后发生某种健康问题的结局,采用统计学方法分析两者之间是否存在关联的一种观察性研究设计方法,可以帮助判断该原料物质的健康风险效益。
病例对照研究(case-control study):指一种以回顾性研究为主的研究方法。通过比较患有或未患有某种健康问题的人群,发生该健康问题前被调查原料物质的暴露状况,分析该原料物质暴露与某种健康问题发生之间是否存在关联。
横断面研究(cross-sectional study):指一种现况调查的研究方法。通过收集特定时点、特定范围内人群中疾病或健康状况的资料信息,分析与之相关的影响因素分布状况,获得可反映该时点某原料摄入量与健康问题的关联。
系统综述(systematic review):指针对要论证的问题,依据标准化方法,对原始研究结果相关研究文献开展系统检索和严格筛选,并通过综合归纳、统计学处理,形成综合性结论的研究方法。
荟萃分析(meta-analysis):指一种运用定量方法汇总多项研究文献的系统综述,采用统计学方法,进行异质性分析及处理多个独立研究的统计量一致性检验,合并效应值计算及检验结果的一种方法。
对于系统综述或荟萃分析,需将其使用的原始研究文献根据此次证据评价的研究文献筛选标准进行筛选后对原始研究文献进行评分。
A.2 单篇研究文献质量评价
A.2.1 研究设计类型评分
其评分标准如表 A.1 所示。每一项研究文献均根据研究设计获得评分。
表 A.1 研究设计类型评分表
试验设计 |
赋分 |
随机对照试验 |
4 |
半随机对照试验(即交替分配或其他方法分配),如按照日期的奇数、偶数分组 |
3 |
非随机对照的比较性研究,如非随机的同期对照研究,队列研究,病例对照研究,有平 行对照的间断时间序列研究 |
3 |
无同步对照的比较研究,如历史性对照研究,非同期的 2 组或多组研究,无平行对照组 的间断时间序列研究 |
2 |
仅有干预结果的病例系列和干预前后对照的病例系列,横断面研究 |
1 |
注:观察研究中大人群(>1 万人)和长期观察(>10 万人年)研究在原评分的基础上+1 分。 |
A.2.2 研究实施情况评分
表 A.2~表 A.5 分别列出不同研究设计类型的研究在评价研究实施情况的评价项目、分级及赋分。
分级的判断阈值可根据保健功能的特性调整并提供依据。
表 A.2 随机对照试验研究实施情况评分表
评价项目 |
分级 |
赋分 |
入组样本量 |
试验组等于或超过 50 人 |
1 |
试验组小于 50 人 |
0 |
|
盲法 |
双盲(或三盲) |
2 |
单盲 |
1 |
|
无盲 |
0 |
|
失访率 |
≤20% |
1 |
>20% |
0 |
|
干预时间 |
≥2 个月 |
1 |
<2 个月 |
0 |
表 A.3 队列研究实施情况评分表
评价项目 |
分级 |
赋分 |
新发病例 |
随访每年出现新病例或事件等于或超过 100 例 |
1 |
随访每年出现新病例或事件小于 100 例 |
0 |
|
盲法 |
盲法(如针对指标检测人员、数据分析人员等设盲) |
1 |
无盲 |
0 |
|
失访率 |
≤20% |
1 |
>20% |
0 |
|
混杂因素(试验设计或统计分析时) |
控制 |
1 |
无控制或未纳入关键的混杂因素 |
0 |
|
随访时间 |
≥2 年 |
1 |
<2 年 |
0 |
表 A.4 病例对照研究实施情况评分表
评价项目 |
分级 |
赋分 |
样本量 |
病例组人数超过 100 人 |
1 |
病例组人数 50~100 人 |
0.5 |
|
病例组人数小于 50 人 |
0 |
|
盲法 |
盲法(如针对指标检测人员、数据分析人员等设盲) |
1 |
无盲 |
0 |
评价项目 |
分级 |
赋分 |
病例与对照的匹配 |
匹配 |
1 |
不匹配或匹配不恰当 |
0 |
|
混杂因素(试验设计或统计分析时) |
控制 |
1 |
无控制或未纳入关键的混杂因素 |
0 |
|
统计分析 |
研究对象均纳入分析 |
1 |
研究对象不是全部纳入分析 |
0 |
表 A.5 横断面研究实施情况评分表
评价项目 |
分级 |
赋分 |
资料来源 |
明确 |
1 |
不明确 |
0 |
|
样本量 |
调查人数超过 5000 人 |
1 |
调查人数 1000~5000 人 |
0.5 |
|
调查人数小于 1000 人 |
0 |
|
应答率 |
≤20% |
1 |
>20% |
0 |
|
纳入及排除标准 |
有 |
1 |
无 |
0 |
|
混杂因素(试验设计或统计分析时) |
控制 |
1 |
无控制 |
0 |
A.2.3 效应值
效应值是一种度量效应大小的指标。可根据效应值的大小判断具有显著统计学差异的研究结果是否具有实际意义或重要性。统计学意义和临床意义的关系可见图 A.2。对于临床意义的判断,需要根据与保健功能最相关的指标,根据其变化值对临床预后的影响来进行评断。效应值评分表见表 A.6。
图 A.1 统计学意义和临床意义关系示意图
表 A.6 效应值评分表
效应值 |
赋分 |
结果具有统计学意义,且整个置信区间的数值都具有临床意义 |
4 |
结果具有统计学意义,但置信区间中包含无临床意义的值 |
3 |
效应值 |
赋分 |
结果具有统计学意义,但整个置信区间都不具有临床意义 |
2 |
结果无统计学意义,但置信区间包含有临床意义的值 |
1 |
结果无统计学意义 |
0 |
A.2.4健康相关性
对于降低疾病发生风险因素的相关研究文献,已进行效应值评价的指标,根据指标的特征可以分类为临床结局、替代结局和病人相关结局(病人最关心、对其生活质量影响最大的结局指标),并对每篇研究给出健康相关性评价得分和判断理由。对于维持或改善机体健康状况的相关研究文献,依据效应值与健康状况声称内容的相关程度酌情赋分。健康相关性评分表见表A.7。
表 A.7 健康相关性评分表
降低疾病发生风 险因素结局 |
举例:2型糖尿病 |
维持或改善机体健康状况结局 |
举例:维持正常 血糖水平 |
赋分 |
病人相关结局 |
并发症发病率 |
某健康声称的直接指标 |
血糖水平 |
3 |
临床结局 |
发病率 |
某健康声称的强相关指标 |
胰岛素水平 |
2 |
替代结局 |
血糖水平、胰岛素抵抗 |
某健康声称的弱相关指标 |
炎症因子 |
1 |
A.2.5文献质量评分
单篇文献的文献质量评分 = 研究设计类型评分+ 研究实施情况评分 + 效应值评分 +健康相关性评分。
A.3证据体综合分析
A.3.1文献质量
纳入的所有研究文献的文献质量得分 = 纳入的每一篇研究文献的文献质量得分总分/ 证据体中研究文献数量。
按照表A.8的等级划分标准分为优、良、中、差4个等级。
表 A.8 证据体文献质量等级划分
证据体文献质量得分 |
等级判断 |
13~16 |
优 |
9~12 |
良 |
5~8 |
中 |
1~4 |
差 |
A.3.2一致性
一致性指纳入的所有研究文献的结论的是否相同或类似。可根据A.9进行等级划分。
A.9 一致性等级划分
一致性 |
等级判断 |
所有研究文献结果均一致 |
优 |
≥70%的研究文献结果一致 |
良 |
50%~70%的研究文献结果一致 |
中 |
≤50%的研究文献结果一致 |
差 |
A.3.3有效率
按照纳入的所有研究文献中发现具有保健功能的比例来划分等级(表A.10)。
表 A.10 具有保健功能比例等级划分
有效率 |
等级判断 |
所有研究结果均显示某物质或原料具有某种保健功能 |
优 |
≥70%研究结果显示某物质或原料具有某种保健功能 |
良 |
50%~70%研究结果显示某物质或原料具有某种保健功能 |
中 |
≤50%的研究结果显示某物质或原料具有某种保健功能 |
差 |
A.3.4人群相似性
按照纳入的所有研究文献中研究人群与中国人群的相似性进行来划分等级(表A.11)。
表 A.11 研究人群与中国人群相似性等级划分
研究人群 |
等级判断 |
研究人群的人群与中国人群一致(中国人群、东亚人群、东南亚人群) |
优 |
研究人群的人群与中国人群相似(亚洲人群) |
良 |
虽然证据体涉及的研究人群种族与中国人群相异,但和年龄差异较小,故可以合 理应用(欧、美人群) |
中 |
构成证据体的研究人群与中国人群相异,很难判断在效果上对中国人群是否合理 |
差 |
A.3.5适用性
按照纳入的所有研究文献得出的研究结果是否适用于目标人群,以及在应用时需要注意的问题来划分等级(表A.12)。
表 A.12 适用性等级划分
适用性 |
等级判断 |
直接适用 |
优 |
适用但有个别注意事项 |
良 |
适用但有许多注意事项 |
中 |
不适用 |
差 |
A.4证据强度的判断
通过对纳入的所有研究文献的文献质量、一致性、有效率、人群相似性和适用性这5项进行综合。根据表A.13所列评分标准,得出证据强度等级初步意见。
表 A.13 证据强度等级划分
证据强度等级 |
评价指标 |
A |
5项为优秀 |
B |
3~4项为优秀或良好且有效率至少为良好 |
C |
1~2项为优秀或良好 |
D |
5项评价指标中,无1项评为优秀或良好 |
根据表A.14所例举的影响证据强度的因素,对证据强度初步意见(等级)进行调整,并最终确定证据强度等级。
表 A.14 降低或提高证据强度等级的影响因素
因素 |
判断标准 |
|
|
1)偏倚风险:文献质量存在严重或非常严重的问题 |
所列五个因素中任意一个 |
可能降低随机对照研 |
2)不一致性:存在重大不一致 |
因素,可根据其存在问题 |
究证据强度等级的因 |
3)不确定性:存在一些或较大的不确定性 |
的严重程度,证据强度等 |
素和标准 |
4)不精确性:数据不精确或不全面 |
级降1级(严重)或2级(非 |
|
5)发表偏倚:报告可能存在较大的偏倚 |
常严重) |
可能提高观察性研究 |
|
所列三个因素中任意一个 |
(如队列研究、病例 |
因素,可根据其大小或强 |
|
对照研究、横断面研 |
度,证据强度等级升1级 |
|
究等)证据强度等级 |
(如相对危险度大于2)或 |
|
的因素和标准 |
2级(如相对危险度大于5) |
A.5 评审工作组推荐意见和结论
评审工作组根据证据评价报告,结合专业理论、社会因素和经验等,写出维持证据强度等级或提升/降低证据强度等级的建议。并写明支持或调整的原因。
维持或改善机体健康状况的保健功能,至少需要证据强度等级为C级;降低疾病风险因素的保健功能至少需要证据强度等级为B级时,表明提出的科学问题为支持性研究证据,可以用于国家/省级申报保健食品相关证据或技术指南证据材料使用。
附录 B
(规范性)
保健功能声称证据报告编制格式和要求
报告首页:报告首页信息包括报告名称、申请人、年月日 目录页:给出报告的目录和相对应的页码
第一部分 申请人及证据评价人员相关信息一、申请人信息表
写明申请人名称、统一社会信息代码(个人填写身份证号)、地址、联系电话、联系人、单位性质(企业、科研院所、高等学校、个人等)、保健食品原料名称、推荐摄入量、申请的保健功能声称内容、适宜人群、不适宜人群等信息。
二、证据评价人员信息
写明人员姓名、工作单位、职称、专业或研究领域、已经参加证据评价培训情况、在证据评价中承担的工作,并手写签名。当用于保健食品等申报时,应附委托书。
第二部分 报告正文
一、研究背景和目标
某种保健食品原料和某种保健功能关系的研究背景,阐明该原料或物质资源情况,生理功能,人群研究状况以及国外声称的现状。
证据报告的目标以及开展某项功能声称研究的必要性。
二、方法和程序
方法至少包括文献检索、筛选及纳排标准和程序等。
提出检索关键词和检索式。检索关键词需提供中英文两种,及关键词的同义词、别称、模糊检索词、关联词等。检索式使用(),AND、OR、NOT 等清晰表明检索逻辑;描述检索的数据库名称、检索式和检索结果;以条目方式明确描述研究文献成为本标准所要求的科学文献的纳入/排除标准,绘制纳入/排除流程图,表明纳入/排除的过程、数量变化及主要理由。若有多篇文献来自同一人群的同一个干预研究,应仅纳入一次。
三、证据综合评价
至少包含“**物质或原料的**功能声称”证据评价过程的以下内容。
(一)证据体纳入文献概要表
以表格方式列出纳入证据体的所有研究文献的具体信息,包括但不限于文献名称、发表年份、研究类型、研究方法、例数、研究对象/年龄、摄入形式、摄入量、干预/观察时长、主要结果、不良反应等。
(二)文献质量评分
以表格形式列出纳入研究文献在研究设计类型、实施情况、效应值、健康相关性的得分和理由,并计算每一项研究文献的文献质量评分。
(三)证据体概况和质量分析
描述证据体研究概况,分析计算所有研究文献(证据体)的文献质量评分总和,得出证据体质量平均分及对应等级。
(四)综合证据评价和证据强度
进一步根据不同研究文献的一致性、有效率、人群相似性、适用性初步得出证据强度等级,并考察是否存在表 A.14 中所列出的降低或提高等级的因素后,最终得出证据强度等级。需记录过程中每一步的得分、理由。
四、结论和建议
简要和明确地描述物质/食物、适宜人群、剂量、指标和结果,总体证据强度、等级结论。明晰有无不良反应记录、是否是首次证明等。
五、主要参考文献列表
提供符合 GB/T 7714—2015《信息与文献 参考文献著录规则》的参考文献列表。
第三部分 附件 文献全文和支持性证据
一、目录和页码
二、主要参考文献全文提供重要研究文献的全文
三、国际情况
相关权威国际组织或各国政府相关机构国际组织及世界各国法规政策,也可包括权威组织发布的系统综述或健康声称证据报告。
四、摄入量资料
包括但不限于本国居民摄入量资料调研、我国已批准保健食品原料及对应保健食品功能状况分析等。
五、其他相关资料
安全性资料,帮助生成研究假设和机制阐释的背景信息的动物和体外研究文献摘要等。
第四部分 审评推荐建议或结论
本部分由证据报告评审工作组完成。清晰描述观点和推荐意见,列出工作组名单,
总体最多不超过 1200 字(小四号字体,1.5 倍行距,不超过 2 页纸)。
根据证据评价报告和给出的证据强度等级,结合其他支持材料、专业理论和专业经验等,形成可用于该保健食品原料和保健功能关系的建议证据强度和推荐意见。
在观点描述中应描述与证据报告强度一致性或不一致的理由,例如文献质量、人群多少、相关机制等证据体相关证据权重真实、可信、符合科学逻辑等方面;实际或理论意义,特别是具体物质或原料在哪类人群、具体什么剂量单位下,具有什么保健功能;评价指标是否合理;文献中有无不良反应记录;其他国家权威机构的采用情况等。
最后列出评审工作组所有成员单位职务职称并签署姓名确认(最少 5 人)。
参 考 文 献
- WS/T 578.1 中国居民膳食营养素参考摄入量 第 1 部分:宏量营养素
- WS/T 578.2 中国居民膳食营养素参考摄入量 第 2 部分:常量元素
- WS/T 578.3 中国居民膳食营养素参考摄入量 第 3 部分:微量元素
- WS/T 578.4 中国居民膳食营养素参考摄入量 第 4 部分:脂溶性维生素
- WS/T 578.5 中国居民膳食营养素参考摄入量 第 5 部分:水溶性维生素
————————————