师旷IPO在即,看清“艾首股”的商业真相

导言:被视为硅谷创业圣经的《从0到1》一书提到,垄断企业有自己的壁垒,无非是专利技术、网络效应、规模经济或品牌优势。被资本行业誉为“人工智能第一股”的师旷科技即将登陆香港交易所。招股说明书开头是首席执行官因基给投资者的信,信中说,“深入学习是师旷的核心竞争力”。 深度学习?这似乎与书中提到的四个指标不一致。以匡为代表的人工智能公司的核心竞

导言:被视为硅谷创业圣经的《从0到1》一书提到,垄断企业有自己的壁垒,无非是专利技术、网络效应、规模经济或品牌优势。被资本行业誉为“人工智能第一股”的师旷科技即将登陆香港交易所。招股说明书开头是首席执行官因基给投资者的信,信中说,“深入学习是师旷的核心竞争力”。

深度学习?这似乎与书中提到的四个指标不一致。以匡为代表的人工智能公司的核心竞争力是什么?要理解这个问题,首先必须了解他们的商业模式是什么。所以我突然想到了以下问题:

人工智能是一家软件公司吗?它是SaaS、PaaS还是传统软件供应商?

人工智能是解决方案提供商吗?它是集成商吗?还是外包公司?

人工智能的障碍是什么?它真的是以“深度学习”为代表的人工智能技术吗?

Alpha Go在2016年启动了所谓的“人工智能第一年”,但仅仅两三年后就发现“投资者逃离了人工智能”。外界怀疑的焦点无非是技术突破的“瓶颈”和“不明确”的商业模式。

Inky的评论似乎是对第一点的回应,而第二个问题需要完整的数据支持和严格的逻辑分析。它直接根据资本趋势和主观感受做出假设。我认为这是一种机会主义行为。因此,以下内容希望引导您逐一回答上述问题,最终打开一个更核心的话题:

类似于在传统软件方面的革命,以匡为代表的人工智能公司的商业模式真的有颠覆性的创新吗?

无论答案是“是”还是“否”,只有对这个问题有了清晰的认识,才能客观地判断出人工智能的核心指标、竞争力和未来。如果你坚持要看结局,文的结局就是一个鸡蛋。

什么是“人工智能公司”

首先,我们需要给以匡为代表的人工智能公司一个基本的定义,这里具体指的是在人工智能的基础上自主开发原创的、不可替代的技术,并且已经或已经扩展到垂直行业并形成相关产品或解决方案的企业。

为了更好地理解这句话,参照阿里云在2016年云人居大会上发布的《人工智能:未来制胜之道》报告,业界对人工智能产业链达成如下共识:

在基本层面上,传统互联网公司和大型芯片工厂具有明显的先发优势。因此,国内大部分人工智能公司将从技术层或应用层开始,随着技术的沉淀和业务的拓展,两层之间的界限现在逐渐模糊。但总的来说,初创企业有两条发展道路:

以场景(如人脸识别)为切入点,通过连接企业客户的内部系统或传感器等自建场景门户获取数据,并基于多维数据不断训练模型和优化算法,寻找场景问题的最佳解决方案,然后复制到其他行业的类似场景中。

以通用技术(如机器视觉)为突破口,深入挖掘算法和底层框架,特别是当机器学习被业界接受时,从底层驱动训练模型不仅可以提高方案在不同场景下的通用性和计算效率,而且最终提高实际应用效果。

前者对现场了解较深,易于接触客户和积累数据,因此产品更容易被客户接受,流动性更强。后者希望利用算法和基础框架的优势有效地接触到更多的行业,使该行业的合作伙伴能够通过公开合作获得数据,这种合作可能不会直接接触到客户,因此覆盖范围很广,但流动性很弱。

我们暂时不会讨论哪条道路更好。我们需要达成共识的是,我接下来要谈的“人工智能公司”也是从技术或应用层开始,沿着上述任何一条或多条发展道路成长,以人工智能技术为核心,以其他计算方法无法替代为前提。

公平地说,我将选择资本行业和行业认可的相关人工智能公司及其公开数据。去年7月,主要将视觉技术用于手机镜头的宏软科技进入了科学创新板。今年8月,“机器视觉四小龙”之一的师旷科技向香港交易所提交了首次公开募股(IPO)招股说明书。最近,以语音识别为核心技术的a股上市公司HKUST迅飞也迎来了两年来的最高市值。

因此,我想不出任何更合适的时间来思考上述问题。

忽视的基本原理也是人工智能的真理。

在深入分析之前,我一直非常重视了解企业的历史演变和发展里程碑。这不仅能揭示创始人的初衷,还能显示每一次突破背后的驱动力是什么。在此基础上,可以对企业的战略、风险和发展目标做出独立客观的判断。

(来源:公共信息,招股说明书)

根据智虎提供的信息,师旷在2013年曾数次尝试在消费端做基于人脸识别的解锁应用,甚至制作了娱乐应用“人脸大师”。当时,移动互联网创业热潮正在兴起。这个选择是可以理解的。然而,直到2015年,蚂蚁金融服务公司的合作项目支付宝“微笑支付”才正式开始商业化并进入该行业。师旷的发展与上述第二条道路相似,但有趣的是,Face++平台在公司成立的第二年就对外开放了,这似乎预示着未来的技术路线和战略方向。

师旷的商业和管理模式

根据招股说明书,我将公司的产品、商业化和运营模式整理如下:

结合截至2019年6月30日(2019年上半年)的相关财务数据,我们可以对师旷的经营状况有一个初步的了解。

2019年仅仅是收入突破10亿元的第三年。总体收入和增长率并不重要。在仔细观察了每项业务的运营模式和财务数据后,我发现了三个“不寻常”的地方,稍后将逐一探究:

为垂直行业提供云识别的“行业SaaS”的毛利率波动很大,这与美国一系列典型SaaS上市公司的毛利率表现不同。

2019年,“个人设备”业务的毛利率将大幅下降。原则上,早期商业化的企业毛利率应该随着边际成本的降低而上升或至少保持稳定。

面向城市和供应链的物联网解决方案是目前商业化的主要战场。然而,我们能继续用一个更传统的项目系统来保持对市场上所有参与者的竞争力吗?

揭示开放视觉的商业化

首先,我将美国四家典型的SaaS上市公司的毛利率与师旷的“工业SaaS”进行了比较:

回想一下SaaS的基本特征:稳定的高毛利率、按需付费、高度的产品导向和自我宣传(类似于“网络效应”),这也成为SaaS企业面临的日益加深的障碍。尽管师旷所谓的“工业SaaS”的毛利率逐年上升,去年上半年达到87%,甚至高于许多SaaS公司,但从42%到87%的急剧下降的原因是什么呢?

进一步看成本结构,我们发现招股说明书第230页有一段话:“个人网络解决方案(SaaS)的销售成本主要包括数据源成本和云服务成本”,以及“数据源成本主要包括我们调用第三方数据源来提供Face">

对于典型的SaaS企业,销售成本主要是支付给云服务提供商的服务器使用成本。因此,“工业SaaS”和典型SaaS产品之间的唯一区别是数据源成本。这个比例有多大?以下两张图片供参考。

(上图显示了数据源成本与行业SaaS、总收入和成本的比较,下图显示了各种成本在总销售成本中的比例)

从上图中,我们可以发现:

与云服务成本相比,数据源成本占行业内SaaS销售成本的大部分,接近60%。由于2018年全年的平均比重大于2018年上半年,我们有理由相信,2019年全年的平均比重将高于2019年上半年,在过去两年中呈上升趋势。

从SaaS收入在行业中所占的比例来看,数据源成本确实呈下降趋势。然而,到下半年,b股行业普遍进入业务高峰期。同样,参照2018年数据源成本的表现,即使2019年上半年成本比率下降到7%,也不意味着2019年全年的提取率会大幅下降。

大多数当前的行业解决方案使用人脸识别作为典型的使用场景。当识别技术扩展到其他类型的人体、物体、文本等时,自然需要购买大量必要的第三方数据进行模型训练,因此未来数据源的成本比例可能不会逐年下降。

最后,根据公司的整体销售成本结构,外包、云服务和数据源是除硬件之外的其余三大成本。人工智能的三要素:算法、计算力和数据,后两者密切相关。

不禁要问:曾经被誉为新一代生产力的“人工智能”现在会成为企业的“成本中心”吗?

这是第一个“不寻常”的本质。

如何解决人工智能的成本中心?

向下看,第二个“个人设备”业务起步最早,三年保持在90%以上后,2019年上半年毛利率明显下降。这项业务包括两类产品:第一类是为消费类电子设备提供基于人脸识别的解锁功能,类似苹果手机上的“人脸识别”,采用自主开发的方案;二是通过人工智能算法改善手机的摄像效果,提高图像质量,俗称“美”。值得注意的是,人工智能体现在“相机内处理”中,而不是通常用图片编辑软件美化我们拍摄的照片或视频。

因此,手机制造商需要在完成组装之前将相机模块与高质量算法结合起来。招股说明书称“个人设备的销售成本主要包括硬件成本和项目外包或技术服务成本”。毛利率的下降是由“在此期间交付的相机模块的增加(毛利率相对较低且销售成本较高的硬件产品)”来解释的

根据这一说法,个人设备业务不仅为客户提供高质量的算法,而且开始提供配有算法的硬件模块。这种行为合理吗?这将是未来的趋势吗?在适当的时候,在中国有一家叫宏软科技的公司可以参考。其核心业务是为智能手机制造商提供人工智能视觉解决方案。其客户包括三星、华为、小米、OV等。去年7月,它登陆科学创新委员会,市值约300亿元人民币。用下图做一个简单的比较:

从收入和毛利两个方面来看,虹阮已经进入了成熟阶段。基于她全面的招股说明书和财务业绩,她得出以下三个结论:

个人设备业务占2018年总收入的96%。可以认为,宏软的主要业务是为手机制造商提供视觉技术解决方案,这与师旷的“个人设备”业务基本相同。

宏软的个人设备业务通过合同授权给手机制造商,允许客户在约定型号的设备上加载相关算法软件或软件包,收取技术和软件许可费,收费方式与师旷一致。

该业务的收入成本主要来自技术人员,其工资及相关费用包含在公司的运营成本中,人数相对较少(2018年仅为10%),公司授权的相关算法软件或软件包一般不需要生产、包装和运输实物硬件,因此毛利较较高。

在招股说明书中,我也没有看到在开发的初期,是否会提供相机模组等硬件的描述,但在研发模式中,我看到了这样一个流程图:

今天的智能手机更新非常快,相机功能已经成为风格更新的主要升级对象,因此它背后的人工智能算法也需要迭代。如果我们参考上图中项目系统的研发模式,最考验的是企业的产品能力和交付效率。虹阮认为她的主要优点如下:

考虑到移动终端的硬件限制,该算法在不牺牲效果的情况下得到了极大的简化和优化。

积累了大量模块化产品和底层算法库;

与相机产业链的深入合作,如开发的智能模块生产线校准方案和智能手机装配线校准方案,为制造商节省了大量硬件和制造成本,实现了快速大规模生产。

因此,关于毛利率下降的第二个问题,我大致做了以下两个推测,希望师旷能在未来的报告中披露更多相关信息。

由于师旷目前的业务规模还比较小,不具备与手机厂商深度合作的能力,为了提高手机厂商的交货效率,保证质量,有必要提前向手机厂商购买相机模块,以便快速开发和适应特定手机型号的视觉算法,然后经过组装和测试后统一交付给手机厂商。

因此,2019年上半年师旷个人设备业务毛利率的下降可能是暂时的。硬件成本的增加目前只是供应链战略的暂时选择。将来销量达到一定规模后,毛利率很可能会恢复到与宏软相近的水平。

与此同时,洪阮在去年年中的报纸《人工智能开放平台》中提到了一个重要的工作方向,即升级人脸识别和检测的核心引擎,升级人体检测部分的核心算法,供有需要的企业和个人免费试用,从而拓展更多的场景应用。开放平台的目的也是为了增强企业在横向业务拓展中的产品能力,这是决定企业未来毛利率的关键。

我们将这一发现与之前搁置的第一个问题放在一起:

如何避免人工智能成为企业的成本中心?关键是生产产品的能力。如何生产“人工智能”——即大规模生产算法——像福特发明的高效装配线一样,同时尽可能地降低数据源成本和计算功耗(云服务成本)。

云服务的成本是相对可控的,但作为人工智能算法优化中的一个必要数据集,其边际成本真的可以无限降低吗?就SaaS或互联网产品而言,数据集真的有“网络效应”吗?

答案不一定,尤其是在人工智能场景中。

常用词“网络效应”是指人们使用产品越多,其价值就越大,如社交软件。在人工智能场景中,当数据量较大时,数据的“网络效应”反映在训练好的人工智能算法的较高质量上,这反映在较好的识别效果或较高的准确率上,最终在实际应用中产生较大的商业价值。当越来越多的场景使用高质量的算法时,获取数据集的成本就会越来越低。

但是这一切真的合理吗?

美国著名风险投资机构A16Z在一篇名为“数据壁垒的空洞承诺”(承诺在数据屏障中下降空的承诺)的文章中提到,尽管数据在大多数情况下确实具有上述“网络效应”,但由大量数据训练的算法通常可以将精确度提高到50%或更高,但很难进一步升级。本文列举了一个将自然语言处理技术应用于信用卡中心智能客户服务的例子:

蓝线代表每个用户请求(例如“我想更新我的个人信息”),红色区域代表累积请求。研究发现,当用于培训的数据(来自客户服务中心的文档)累积到20%时,它基本上可以覆盖20%的用户请求,但是进一步向上,可以看到曲线逐渐变平,即用于培训的数据越多,水平轴所代表的场景覆盖率就不会随之线性增加,最终保持在40%左右。未来,智能系统将不再能够处理剩余的60%的客户来电。

基于这一研究和对人工智能的基本认识,我认为主要原因如下:

模型训练需要引入机器学习甚至深度学习。由于用于深度学习的多层神经网络仍然是一个“黑箱”,即技术人员很难彻底理解深度网络的核心,也无法完全掌握输入与输出之间的关系、各种参数之间的相互作用等。因此,参数调整和优化是一个非常缓慢的过程。

深度学习需要大量的数据或样本,数据量越大,对数据质量的要求就越高。有必要在真实场景中尽可能多地隐藏极端情况。例如,在客户服务场景中,用户问,“我想知道前天下午去星巴克买卡布奇诺之前,我在学校食堂花了多少钱?”然而,一般第三方数据公司提供的问题集很难达到如此精细的粒度。为了进一步优化算法,有必要在系统内或真实场景中完成极端情况。

因此,当人工智能公司刚刚进入一个新的场景时,它需要得到至少一组最小可行语料库进行训练,找到满足基本场景的算法组合,然后收集尽可能多的极端情况进行连续迭代。这背后有两个问题:

数据采集的成本将随着算法的升级而增加。

与此同时,数据很可能已经过时,旧数据需要立即删除或重新标记。

此外,由于后面的算法迭代需要更长的时间,一方面,服务器成本(通常在云中)将非线性增加;另一方面,人类对数据处理的干预可能是必要的。

从师旷招股说明书中的人员结构也可以看出,“数据标注”人员占公司员工总数的17%,仅次于研发团队。

那么,如何解决人工智能中“数据网络效应”逐渐失效所带来的各种成本问题呢?

师旷的答案是使用自动机器学习(AutoML)和其他技术来独立开发一个深度学习平台“脑++”,以及一个数据管理和标记平台“数据++”。

根据师旷研究院的相关介绍,脑++已经发展成为支持算法研发的基础层,它由三个模块组成:深度学习框架MegEngine、深度学习云计算平台MegCompute和数据管理平台MegData(后称Data++),对应于人工智能的三大要素。涵盖数据采集、清理、预处理等功能。从研究人员的算法架构设计、实验环节、训练环境的构建、训练、参数调整、模型效果评估,到最终的模型分发和部署应用,特别强调了几个独特的优势:

针对计算机视觉任务进行定制优化,尤其是针对大量图像或视频训练任务。

自动线技术使深层神经网络的设计自动化,并使算法的产生自动化,从而允许研究人员定制各种算法组合,包括“长尾要求”(即极端情况),用最少的人力和时间满足垂直碎片的需要。

通过基础设施、数据存储和计算的智能动员,保证多用户、多任务运行,提高培训效率,变相降低云服务成本。

我不是人工智能专家,我不会讨论大脑++的性能和技术高度。然而,前面的问题逐渐得到了回答。匡将对Brain++的投资视为公司的“核心竞争力”,因为在我看来,深度学习框架就像是一个操作系统,可以帮助研究人员根据不同的场景、不同的终端硬件条件以及投资回报率的高低,尽可能自动地找到最佳方案。同时,数据++支持的半自动数据处理和标记功能允许多人同时访问同一组数据进行培训,目的是从根本上降低带宽和标记成本。

这也解释了为什么师旷发布了一个数据集Objects365,它涵盖了14个主要类别、26个次要类别的700,000多张图片,包括超过1,000万个标签盒,这是目前世界上最大的对象检测数据集。因为只有覆盖面越完整,内生数据集的质量越高,外包需求就会越少。

虽然由于内部化,数据源的成本可能会逐渐降低,但这只是一种成本转移。目前还不能确定这种人工智能特有的成本是否能在未来完全消除。Brain++的发展确实有效地阻止了人工智能成为一个不可忽视的成本中心。它不仅具有科研价值和技术壁垒,而且在某种意义上具有重要的商业价值。

回到一个基本问题:那么,按通话次数收费的云身份服务真的是SaaS吗?

否:由于数据源成本不稳定,业务暂时无法维持高确定性毛利,产品化程度与SaaS主流公司不同,后者会根据客户规模开发不同版本。然而,底层设计驱动的灵活支付方式和产品技术路线与SaaS相似。

在这种商业模式的演变过程中,我们需要关注人工智能的特殊性所带来的不可避免的附加成本,关注行业商业化对企业产品能力的挑战。

这是打开两年前市场上倡导的“人工智能即服务”这一独特模式的正确途径。

“友邦保险”的护城河是什么?

第三个问题,城市物联网项目已成为主要收入来源,2019年上半年贡献了70%以上的收入。去年年初,师旷还宣布投资20亿元在供应链物联网业务上,以加快与其合作伙伴的机器人登陆产业。然而,从近年来引入的基于项目的与集成商的合作模式以及一系列传感器和物流自动化设备生产线来看,市场上对人工智能公司的理解存在很多偏差。

此外,在城市安全管理领域,还有海康大华等巨头。智能物流必须面对新兴存储机器人公司的围攻,如Geek+和fast">

从上图海康威视觉的核心财务数据中,我们可以窥见近年来传统巨头的战略。该公司在2018年提出了“人工智能云”。核心是端到端计算架构,涵盖多维获取、智能分析、后端算法迭代和资源调度。回顾之前关于脑++的讨论,我相信每个人都更容易理解“人工智能云”的核心概念和下图所示的产品形式。

对师旷来说,如果与类似的人工智能机器视觉公司相比,脑++是他们技术上的一把利剑。然后在商业化的过程中,一个结构化的底层系统会让他们在与巨人的持久战结束时开怀大笑。这个逻辑类似于脑++的开发。只有开放的系统平台才能同时满足现有市场和新的需求,尤其是对于吝啬的企业客户。如果能够通过连接客户现有的设备和相关软件来提供更好的分析结果,这将大大降低客户和合作伙伴的使用门槛。师旷称这个底层系统为“平台软件”

这张照片不仅让我想起了“中国-台湾”的概念,还让我想起了格雷洛克(Greylock)提出的一个名为“智能系统”的概念。格雷洛克是一家风险投资机构,投资了诸如Cloudera和Docker等明星企业服务公司。我认为这将是新一代企业,特别是人工智能公司建造护城河的基础。

简而言之,智能系统层可以跨平台获取和集成底层的所有信息和数据源,并结合人工智能(AI、大数据、云)功能,为客户提供实时、准确或个性化的分析。未来的壕沟战将从“如何获取更多数据”转变为“如何更智能地使用数据”。这是一个连续的迭代过程,障碍会越来越大。

因此,从两年前“城市管理大脑”的提议到去年年初兼容多种类型机器人的操作系统“河流地图”的发布,师旷确实意识到系统软件是人工智能商业化的核心,未来的策略不是向客户销售更多智能硬件产品以获得市场份额。

(“河图平台”生态连接设计)

我们经常听到一个词叫做“商业闭环”。建立智能系统层正是实现内外双向交互和闭环的过程。更重要的是,一旦从数据采集、传输、分析到决策反馈形成一个流程闭环,以硬件产品为核心的传统销售方式将逐渐成为一种以软件驱动硬件产生实时效果的服务模式,客户可以根据自己的需求或效果灵活付费。从国情来看,这在城市物联网的管理和安全市场中可能并不理想,但在物流、零售、泛金融甚至海外市场中一定会找到合适的立足点。

以人工智能为中心的智能系统不仅能为企业建造更坚固的护城河,还能以SaaS式的商业模式挑战传统行业的老玩家,就像当年Salesforce撼动甲骨文一样。从这个角度来看,以师旷为代表的“友邦保险”似乎在商业模式上无限“接近”SaaS。

回顾开始时提出的核心问题:

“人工智能”真的会成为被忽视的“成本中心”吗?公司如何解决看似不可避免的数据源和云服务成本问题?

师旷提到的“工业SaaS”真的是SaaS吗?曾经唱过的“友邦保险”模式是什么?

“友邦保险”的护城河在哪里?师旷是怎么做到的?

最后,我的回答是:

我们仍然不能将当前业务中的“SaaS”与市场上通常理解的“SaaS”产品等同起来,因为暂时不可避免的数据源成本会导致不可预测的毛利率波动。

在算法模型的迭代过程中,数据不会产生理想化的网络效应。为了避免数据、计算和其他资源成为成本中心,自动算法生成和数据标注可能是最有效的解决方案,因此这将更多地测试公司在深度学习和其他底层技术以及战略规划方面的成就。

人工智能公司在商业化过程中会遇到各种各样的障碍。只有将产品销售思维转变为可持续的服务模式,它才有机会突破。核心是从战略上设计智能系统层,建立生态联系。

“人工智能第一股”的未来

既然你已经了解了师旷的历史和基本情况,那就展望未来吧。

有几件事我认为可能适合匡上市后考虑:

开源(或部分开源)大脑+:目前,两个开源深度学习框架谷歌的TensorFlow和脸书的PyTorch相持不下,性能不会被评估。有趣的是,首先进入主流的天梭流以稳定的性能和安全牢牢占据了行业,而后来进入的PyTorch通过易用性和简单的操作在学术界撕开了一条裂缝。相比之下,开放视觉的优势必须在于机器视觉引以为傲的垂直方向,而保持其在该领域领先地位的重要途径是建立开发者生态。基于国内得天独厚的数据和商业场景的优势,如果机器学习甚至深度学习成为未来下一代信息技术建设的标准,至少在视觉领域,它将能够充分利用时间、地点和人员。

为模型培训创建一种标准语言,并对生态学持开放态度:我听说该团队自2018年以来一直在为深入学习培训规划一种编程语言,以协调培训所需的灵活性和推理所需的性能要求。去年2月,脸书首席人工智能科学家Yann">

布局制造业:制造业占中国国内生产总值的近三分之一。机器视觉是国外第一个进入工业领域的技术,主要用于尺寸测量和外观检测。如今,在硬件方面,自然光、红外光、激光和2D到3D相机正如日中天。海康微视还在2017年发布了一系列工业相机。人工智能在软件方面的探索才刚刚开始。虽然样本数量和质量的缺乏给深度学习的落地造成了一些障碍,但这也许只是一个开放视野及其开放生态的机会。在真正的场景和需求明确之前,相关的布局会提前进行。这是另一个100亿的市场。

更多关注微信:xllx999

CopyRight 2002-2020 闻蜂网