从技术问题的角度破坏“三步法”的评述逻辑

2025-02-07

  文/北京集佳知识产权代理有限公司 刘成

 

  《专利法》第22条第3款规定授予专利权的发明应当具备创造性条件,而实际专利申请业务中,相对于其他不予授予专利权的理由,创造性不足,通常是影响专利授权的主要原因。

  判断发明类型的专利是否满足创造性条件,具体是判断专利技术方案相对于现有技术是否具备突出的实质性特点以及显著的进步。简单来说,具备突出的实质性特点,是指专利技术方案相对于现有技术具有明显的“差异”,并且,对于本领域技术人员而言,这种差异也并非显而易见,即本领域技术人员难以通过合乎逻辑的分析、推理或者有限的试验得到该差异。显著的进步,是指专利技术方案因为具备该“差异”,能够产生有益的技术效果,可以是现有技术无法企及的技术效果,也可以是与现有技术同等的技术效果。

  相应地,在审通答复阶段,也是围绕发明具有突出的实质性特点以及显著的进步来抗辩发明满足专利可授权的条件。

  目前,“三步法”,成为了主流的审通答复思路。

  在“三步法”的第二步中,审查员通常会比较本申请的权利要求1与审查员提供的对比文件1,确定区别技术特征以及该区别技术特征所实际要解决的技术问题,而发明能够获得授权的关键,很大程度上取决于利用区别技术特征解决该技术问题,是否为另一现有技术或者公知常识。

  评判利用区别技术特征解决该技术问题是否为现有技术或者公知常识,不仅要分析该区别技术特征所描述的技术实现,是否为另一现有技术所记载的技术实现,或者是公知的技术实现;同时,还需要分析该区别技术特征在本发明中所具有的作用,是否同样在现有技术中记载,或者被本领域技术人员所公知。

  在专利实务中,如果区别技术特征所描述的技术实现没有被另一现有技术记载,或者不属于公知的技术实现,通常能够较为容易说服审查员以获得专利授权。但是,在另一现有技术或者公知常识记载了该区别技术特征所描述的技术实现的情况下,专利能够获得授权,主要取决于在答复审查意见的过程中着力抗辩区别技术特征在本发明所具有的作用未被记载或者不被公知。相对技术实现未被公开来说,抗辩区别技术特征的作用未被公开,审查员的接受程度往往较低(下面以区别技术特征所描述的技术实现被公开、区别技术特征所具有的作用未被公开为前提进行说明)。

  其实,区别技术特征在本发明中所具有的作用,对应于该区别技术特征所实际要解决的技术问题。因此,在答复审查意见的过程中,抗辩区别技术特征在本发明中所具有的作用未被公开,其实就是在陈述现有技术无法解决本发明实际要解决的技术问题。但是,从技术问题的角度进行抗辩,是在破坏审查员用“三步法”否定本专利不具有创造性的评述逻辑,这有利于增大对于审查员的说服力度。

  此时,在意见陈述时所主张的本发明实际要解决的技术问题是否正确,成为本发明能否获得授权的关键。

  那,什么才是正确的技术问题?

  从获得专利授权的角度考虑,正确的技术问题,应当与区别技术特征在现有技术或者公知常识所能解决的技术问题并不一致,具体是本发明能够解决现有技术或者公知常识所不能解决的技术问题,以此才能凸显本发明中利用该区别技术特征解决特定的技术问题(现有技术解决不了的技术问题)所具有的创新性。

  回到我们最初想要强调的区别点:区别技术特征在本发明中的具有独特的作用。即,区别技术特征的作用,是在本发明的实施环境下所具有的特定作用,所以,所解决的技术问题,应该也是本发明的实施环境下所存在的特定的技术问题。也就是说,在陈述区别技术特征实际要解决的技术问题时,应当体现产生该技术问题所处的实施环境约束。

  为了便于更好的理解,下面结合一个案例进行说明。

  在迭代训练AI模型过程中,可以动态调整AI模型的Batchsize的取值。其中,Batchsize的取值(为AI模型中的一种超参数),用于指示AI模型在一轮训练过程中所使用的训练样本的数量。Batchsize的取值越大,单轮训练过程中AI模型所使用的训练样本越多,这使得AI模型在训练过程中的参数更新越稳定,从而加速AI模型的收敛,AI模型的训练耗时越短。反之,Batchsize的取值越小,单轮训练过程中AI模型所能使用的训练样本的越少,AI模型的收敛速度越慢,但是单轮训练过程中所引入的随机性越多,能够避免AI模型陷入局部最优,从而能够保证AI模型的训练准确性。

  为此,本发明的技术方案提出在训练AI模型的过程中,根据不同轮次的梯度(用于更新模型中的权重等参数)差异来调整Batchsize的取值。

  具体地,在模型经过h轮训练后记录第h轮训练AI模型的过程中所采用的梯度。然后,继续对模型进行k轮训练,k为整数。接着,计算第h轮训练的过程中所采用的梯度与第(h+k)轮训练过程中所采用的梯度之间的余弦值。并且,当余弦值小于预设阈值时,表明在多轮训练AI模型的过程中,AI模型的参数并没有朝着相同或相近的方向进行变化,也即AI模型处于不收敛的状态。此时,可以增大Batchsize的取值,来加速AI模型的收敛,以此实现加速AI模型的训练。

  其对应的权利要求1如下:

  1、一种模型训练方法,其特征在于,所述方法包括:

  在迭代训练人工智能AI模型的过程中,记录AI模型在第h轮训练时所采用的第一梯度,所述第一梯度用于更新所述AI模型中的目标参数的取值;

  记录所述AI模型在第(h+k)轮训练时所采用的第二梯度,所述第二梯度用于更新所述目标参数的取值;

  计算所述第一梯度与所述第二梯度之间的余弦值;

  当所述余弦值小于阈值时,增大所述AI模型的Batchsize的取值;

  基于增大后的Batchsize的取值,继续训练所述AI模型。

  审查员在审查过程中,检索到一篇训练AI模型的现有技术,并通过技术特征比对,确定区别技术特征如下:

  A:计算所述第一梯度与所述第二梯度之间的余弦值

  B:当所述余弦值小于阈值时,增大所述AI模型的Batchsize的取值

  基于上述区别技术特征,由于增大AI模型的Batchsize取值能够加速AI模型的训练速度,因此,审查员确定该区别技术特征A和B实际要解决的技术问题在于:如何提高AI模型的训练效率。

  其中,审查员进一步检索到增大Batchsize的取值能够加速AI模型训练的其他现有技术,并以此否定区别技术特征B所具有的创造性。同时,计算两个张量之间的余弦值,也是本领域公知的技术实现。

  针对审查员上述的评述逻辑,笔者不排除有其他可适用的答复思路。但是,如果从破坏“三步法”的评述逻辑出发进行答复,那确定正确的技术问题,将是能否说服审查员以获得专利授权的关键。

  如果仔细分析审查员所定义的实际要解决的技术问题,可以发现:实现提高AI模型的训练效率,其实仅依靠区别技术特征“增大所述AI模型的Batchsize的取值”即可做到,所以,审查员在定义实际要解决的技术问题时,并没有考虑到计算两个梯度之间的余弦值以及增大Batchsize取值所需满足的条件这两个特征,所以,审查员定义的技术问题,为片面的、不正确的技术问题。

  相应地,在进行创造性抗辩时,基于上述区别技术特征所定义的正确的技术问题,应该综合考虑全部区别技术特征。

  仔细分析,既然增大Batchsize的取值能够加速AI模型的训练,那为什么本发明不在模型训练的初始阶段,就设置尽可能大的Batchsize的取值,这样,AI模型的训练效率理论上就能达到最快。原因很简单,在训练AI模型时,不仅要考虑AI模型的训练效率,还要考虑到训练得到的AI模型的准确性。如果最终训练得到的AI模型在推理时的准确性很低,那么这个AI模型即使是在1秒之内就能完成训练,也是没有意义的。在前面介绍技术背景的时候也提及了,如果Batchsize的取值过大,容易导致AI模型在训练时陷入局部最优,影响AI模型的准确性。所以在本发明的技术方案中,是在两个轮次的梯度之间的余弦值小于预设阈值时,才会选择增大Batchsize的取值,这是为了在确定AI模型不收敛的情况下,才会选择增大Batchsize的取值来加速AI模型收敛,也即加速AI模型训练,也就是说,在AI模型本身已经收敛的情况下(即两个梯度之间的余弦值大于预设阈值)的情况下,无需增大Batchsize取值(避免AI模型陷入局部最优)。如此,不仅可以在适当的时机通过增大Batchsize取值来实现模型训练加速,而且,也能保证最终训练得到的AI模型的精度能够达到较高水平。

  对于本发明而言,仅片面考虑AI模型的训练效率是没有意义的,提高AI模型的训练效率一定是在能够保证训练得到的AI模型的精度能够达到较高水平的基础上实现的优化目标。所以,我们在意见陈述时,基于区别技术特征所定义的本发明实际要解决的技术问题,应当是:在保证AI模型的训练精度能够达到较高水平的情况下,提高AI模型的训练效率。即,“保证AI模型的训练精度”,是实现“提高AI模型的训练效率”的实施环境约束。

  结合我们定义的技术问题进行分析,现有技术虽然公开了增大Batchsize的取值能够提高AI模型的训练效率,但是无法保证训练得到的AI模型的精度能够达到较高水平,所以审查员检索到的现有技术无法解决本发明实际要解决的技术问题。既然现有技术解决不了本发明能够解决的技术问题,破坏了“三步法”中的第三步的评述逻辑,那自然而然本发明应当具备创造性,符合专利授权的条件。

  笔者建议,在定义实际要解决的技术问题时,应当充分考虑全部区别技术特征对于解决技术问题的贡献,这样才能挖掘出技术问题所处的实施环境的约束。正如上述举例中,应当考虑为什么在选择增大Batchsize的取值时,需要满足两个轮次的梯度之间的余弦值小于预设阈值这一实施条件,基于这个实施条件的作用,挖掘出需要保证AI模型的训练精度的目的(也即实施环境的约束),以此才能制定正确的、本发明实际要解决的技术问题。

  以上是笔者针对答复审查意见过程中的一些思考总结,对于存在的不妥之处,还请读者批评指教。

  

此篇文章由北京集佳知识产权代理有限公司版权所有,未经授权请勿转载     

 

相关关键词