近年来,得益于计算机硬件性能的突破以及云计算为代表的计算技术的快速发展,人工智能技术得到高速发展,人工智能的研究和应用掀起了新的高潮。目前,人工智能领域已经覆盖了智能客服、商业智能等服务器以及视觉识别和机器学习等技术层。

我国对人工智能领域的知识产权保护也愈发重视,人工智能领域的专利申请,除了可能因方案本身的新颖性和创造性的问题被驳,还可能因专利法第二条第二款、专利法第二十六条第三款和专利法第二十六条第四款而被驳。

则基于此,以下几个撰写中涉及到的问题,是值得思考的:

1.是否属于发明客体?

人工智能领域的专利申请,很多涉及到公式、算法的改进,而针对发明涉及公式和算法改进的专利申请,要如何才能够符合专利法第二条第二款的规定呢?

2.说明书是否公开充分?

对于应用人工智能的专利申请,说明书中关于算法的描述要公开到什么程度?

3. 权利要求是否清楚?

假设模型是用于实现某种检测,并用于输出最终数据,那么检测的过程要不要在权利要求中限定。

基于上述三点考虑,本文研读谷歌和微软近年来在人工智能领域的专利申请,分析该领域的专利申请的发明客体、说明书公开充分以及权利要求的保护范围清楚的问题。

01

客体问题

审查指南第二部分第一章第2小结对不符合专利法第第二条第二款规定的客体有如下描述:

专利法所称的发明,是指对产品、方法或者其改进所提出的新的技术方案,技术方案是对要解决的技术问题所采取的利用了自然规律的技术手段的集合。技术手段通常是由技术特征来体现的。未采用技术手段解决技术问题,以获得符合自然规律的技术效果的方案,不属于专利法第二条第二款规定的客体。

根据审查指南的规定,一项技术方案应该同时具备技术手段、技术问题和技术效果三要素。

则对于一项权利要求是否构成技术方案,审查员一般从以下三点考虑:

(1)权利要求中是否有技术特征,如果没有技术特征,则没有采用技术手段,不是技术方案;

(2)如果有技术特征,判断这些技术特征对于所要解决的问题和实现的效果能否起作用;

(3)判断所要解决的问题和实现的效果是否是技术问题和技术效果。

审查指南中规定,技术手段是指利用了自然规律的手段,而在实际判断一个一个特征是否使用了自然规律,除了能够明确排除永动机之外,似乎很难判定一个手段是否使用了自然规律或者使用了什么自然规律。

而在人工智能领域,由于可能会在权利要求中记载一些算法或者公式等内容,这也引起了一些关于算法和公式是否为技术手段的争议。而笔者认为,算法和公式是否属于技术手段,不能单独只看算法和公式本身,而是应该确定该算法和公式是否能够与具体的技术领域或者算法中的变量是否能够与具体的物理含义相结合。

下面,以具体案例对发明的客体问题分析

二个案例

01

案例一:CN108351984A涉及一种硬件高效的深度卷积神经网络,其方法的独立权利要求为:

12.一种方法,包括:

接收输入图像;

生成所述输入图像的频域表示;

在包括多个卷积层和至少一个全连层的深度卷积神经网络中,至少部分基于所述输入图像的所述频域表示和卷积加权内核的稀疏频域表示来提取多个特征,其中所述卷积加权内核的所述稀疏频域表示包括稠密矩阵和一个或多个稀疏矩阵;

基于经提取的所述多个特征来对所述输入图像进行分类;以及基于所述分类来将所述输入图像标识为包含感兴趣对象。

按照上述三要素判断该权利要求所要求保护的方案是否为技术方案,具体地:

第一步,是否有技术特征。很明显是有技术特征的,因为权利要求所记载的接收输入图像以及生成输入图像的频域表示之后,后续的卷积操作都是针对该图像的频域表示进行的,则该权利要求内的特征都限定在了图像处理领域,并且频域表示和卷积都与图像的物理含义(例如,图像数据)相结合。因此,该权利要求包含技术特征。第二步,判断这些技术特征对于所要解决的问题和实现的效果能否起作用。该申请的背景技术指出:

虽然卷积神经网络与更加局限的基于建模的机器学习方法相比表现良好,但是以硬件实现卷积神经网络导致高能源和计算复杂度成本。例如,卷积层通常涉及高计算复杂度,并且全连层通常涉及高存储器存储成本。这些因素尤其阻碍了卷积神经网络在功率受限设备(诸如可穿戴设备和移动设备)中的实现。

可以看出,该申请所要解决的问题是,卷积层的计算过于复杂导致神经网络对设备的硬件需求过高。

则该方法独立权利要求解决该问题的技术特征为:生成所述输入图像的频域表示;在包括多个卷积层和至少一个全连层的深度卷积神经网络中,至少部分基于所述输入图像的所述频域表示和卷积加权内核的稀疏频域表示来提取多个特征,其中所述卷积加权内核的所述稀疏频域表示包括稠密矩阵和一个或多个稀疏矩阵。

该技术特征的技术效果是:在卷积层中执行的卷积加权在傅立叶(频率)域中进行。时域中的卷积可以转换为频域中的乘法,这降低了卷积加权的复杂度并且使得设备处理速度提高并且功耗降低。

因此,方法独立权利要求中的技术特征对于所要解决的问题和实现的效果有积极作用。

第三步,判断所要解决的问题和实现的效果是否是技术问题和技术效果。由第二步确定的问题为卷积层的计算过于复杂导致神经网络对设备的硬件需求过高,很显然是与具体的技术领域(设备的硬件设置)相结合,则该问题是一个技术问题。因此,CN108351984A在方法权利要求中,能够将算法与实际的图像处理相结合,而并非只记载算法的改进,使得权利要求的特征能够与实际图像 相结合,而并非只是算法本身,以使得所记载的特征为技术特征。 另外,该申请在背景技术中,将算法的复杂度的问题落地到设备的硬件成本上,使得所要解决的问题是一个技术问题。 再者,在说明书中所记载的效果对应到了处理器的处理速度和功耗上,使得整体的方案能够解决硬件在通过卷积神经网络处理图像时速度慢而对硬件设置要求过高的技术问题,从而保证整个方案属于发明客体。

同时,CN108351984A在说明书中花了很大篇幅记载方法权利要求中的每个步骤是如何通过硬件实现的,而方法中的步骤能够与具体的硬件环境相结合,也能够说明方法中的特征是可以通过硬件实现的,而各个硬件设备之间的交互必然是需要使用自然规律(比如,数据传输时的电信号)的,这也对方法的发明客体的问题提供了修改余地。

CN109196582A涉及一种由一个或多个计算机执行的方法 ,该方法包括:

由所述一个或多个计算机确定指示单词的拼写的拼写数据;

由所述一个或多个计算机将所述拼写数据作为输入提供给训练的递归神经网络,所述训练的递归神经网络被训练以至少基于指示所述单词的拼写的数据来指示单词发音的特征;

由所述一个或多个计算机接收指示由所述训练的递归神经网络响应于提供所述拼写数据作为输入而生成的单词的发音的重音模式的输出;

由所述一个或多个计算机使用所述训练的递归神经网络的输出来生成指示所述单词的发音的重音模式的发音数据;

以及由所述一个或多个计算机将所述发音数据提供给文本到语音系统或自动语音识别系统。

人工智能专利核心是以机器学习算法为主,这些算法或计算机程序很多体现为数学模型,例如,神经网络模型。而不同的国家对于人工智能专利申请的客体要求会有不同。例如,在中国和日本,对于网络模型本身的改进也是可以授权的。

基于上述中国审查指南的规定的关于客体的三要素,对案例二中的方案进行分析后发现,案例二中的方案是符合中国审查指南的规定的关于客体的三要素的规定的,即在案例二中的方案中包括有技术特征,例如:1 权利要求中所记载的关于“确定指示单词的拼写的拼写数据”以及“由所述一个或多个计算机接收指示由所述训练的递归神经网络响应于提供所述拼写数据作为输入而生成的单词的发音的重音模式的输出;由所述一个或多个计算机使用所述训练的递归神经网络的输出来生成指示所述单词的发音的重音模式的发音数据”等特征。

其次,对于所包括的技术特征对于所要解决的技术问题是有作用的。从案例的背景技术所记载的内容“一些ASR和TTS系统可以使用手动策划的发音字典。字典中的条目可以包括音位(phoneme)序列,例如,“foo”→/f u/(以X-SAMPA(Extended SpeechAssessmentMethods Phonetic Alphabet,拓展音标字母评估法)表示法)”可知,其所要解决的技术问题是实现自动的基于拼写数据输出发音数据的效果。可以明确的是,上述确定的技术特征对于实现自动的基于拼写数据输出发音数据的效果是有积极作用的。

再者,也可以明确的是,所要解决的技术问题以及所要实现的效果也是技术问题以及技术效果。因此,该案例在国内应当是符合发明客体的。

而对于在欧洲或者美国,纯粹的算法改进可能会存在客体的问题。尤其是,美国针对计算机程序类的审查更加严格,在美国,审查员在判断适格专利客体时采用两步测试,而在两步测试中,如果权利要求中涉及到抽象概念(例如,模型、算法等)会有很大可能被确定存在客体问题。经过资料查找后发现,案例二的US申请确实在美国遇到了101款的审查意见,即不符合申请客体的审查意见。

图1-1

如上图1-1所示,该案的权利要求1要求保护的方案被审查员确定为不符合申请客体,但是审查员对于权利要求5给出了有授权前景的指示。下面我们分别对该案例的权利要求5和权利要求1进行对比:

权利要求1为:

1. A method performed by one or more computers,the method comprising:

determining, by the one or more computers,spelling data that indicates the spelling of a word;

providing, by the one or more computers, thespelling data as input to a trained recurrent neural network, the trainedrecurrent neural network being trained to indicate characteristics of wordpronunciations based at least on data indicating the spelling of words;

receiving, by the one or more computers, outputindicating a stress pattern for pronunciation of the word generated by thetrained recurrent neural network in response to providing the spelling data asinput;

using, by the one or more computers, the outputof the trained recurrent neural network to generate pronunciation dataindicating the stress pattern for a pronunciation of the word; and

providing, by the one or more computers, thepronunciation data to a text-to-speech system or an automatic speechrecognition system.

权利要求5为:

5. Themethod of claim 1, comprising determining, by the one or more computers,pronunciation data thatindicates at least one stress location for the word, wherein:

providing, by the one or more computers, thespelling data as input to the trained recurrent neural network comprisesproviding the spelling data and the pronunciation data as input to the trained recurrent neuralnetwork; and

receiving the output indicating the stresspattern for pronunciation of the word generated by the trained recurrent neuralnetwork comprises receiving the output indicating the stress pattern forpronunciation of the word generated by the trained recurrent neural network inresponse to providing the spelling data and the pronunciation data as input.

比对权利要求1和权利要求5可以发现,权利要求5中相比权利要求1中有更多的非抽象且是具体的技术特征的描述,例如,上述权利要求5中下划线部分。

那么我们可以得到的结论是,在撰写涉及算法或者模型等本身较为抽象的内容的权利的过程中,可以引入更多的具体的技术手段的描述,并且在描述技术效果的过程中,需要强调哪些具体的技术特征的贡献。也就是说,在描述权利要求如何解决技术问题时,可以强调权利要求中技术特征比所包括的抽象概念对于解决技术问题的贡献更大。

小结

在撰写人工智能领域的权利要求时,应该将一些算法应用于一个确定的技术领域与实际的物理含义相结合。例如,获取待处理的图像数据,根据一系列AI算法得到处理后的图像数据。切记不可只描述算法的改进,即需要与实际应用场景相结合。

在进行权利要求撰写过程中,可以针对不同国家对于客体确定的区别而针对性的布局从权,例如,在独立权利要求1中更多的是关于算法或者模型等抽象内容的描述的情况下,从权可以布局更多的细节的技术特征的内容,或者可以布局关于算法或者模型等抽象内容是如何与实际的硬件环境相结合的从权。并且,在描述权利要求如何解决技术问题时,可以强调权利要求中技术特征比所包括的抽象概率对于解决技术问题的贡献更大。