第98章 多目标算法思路(1 / 1)

重生之AI教父 CloseAI 1075 字 2023-05-20

(),

孟繁岐和王恺这段时间沟通颇多,已经挺熟了。

不过看到这句话,孟繁岐还是觉得相当无厘头:“你一个一米八几的肌肉壮汉,我带你走什么啊?是我带你走还是你扛着我走啊?”

“兄弟又被安排来找你了呀。”王恺一边说着,给孟繁岐发了一张机场的照片:“刚到机场,晚上的飞机去尚海。”

“啥情况啊?”

“这不是领导不放心吗,不敢使唤你往燕京来,只能派小弟我往尚海去。”王恺也是身不由己,虽说刚刚立了功劳,但总觉得这工作做得没什么提升。

“领导说,要让我在你身边吃透这部分代码,到时候回去跟大家讲解。”

“还是跟上回一样的活呗。”孟繁岐了然,自己毕竟不是白度的人,李彦弘急着拿政府项目,肯定还是需要派人跟自己交接代码。

单看最后那一下,估计是不放心。因此派了此前和自己一直沟通的王恺来跟着自己,抓紧一分一秒,把孟繁岐新开发的这部分内容彻底掌握。

“行吧,这也没什么,明天我们在合川路附近那个白度的分部见。”

“没问题,哥。”王恺答应得很爽快:“哥你要是以后有用人的时候,一定要想起我,不管什么时间,什么地点,兄弟肯定跟你干了。”

“你这个带我走,搞了半天是这个意思?”孟繁岐这才回过味来。

“那肯定啊,打工肯定是没什么大前途的嘛,安安稳稳领点死工资,一辈子攒不下多少钱来。”王恺也不藏着掖着,直接说出了自己最真实的想法。

“我也不记得是哪里看到的话了,说人这一辈子每天都能至少碰到一个改变自己一生命运的机会,只是自己绝大部分时候都完不知道。”

“改变自己一生也得看怎么改啊,出门被泥头车创飞了也是改变自己一生。”孟繁岐倒是听过另一个版本:“我听过的版本是,一个人在硅谷一辈子一定会碰到一个一夜暴富的机会,俗称五个一。”

“我觉得你就是我的机会,哥,以后要真创业,一定叫上我。小弟绝对尽职尽责当牛做马,鞠躬尽瘁死而后已。”经历了这两次孟繁岐的技术冲击,王恺已经彻底折服于他的技术实力之下。

很多时候算法不是能不能写出来的问题,而是能不能想得到。

过去几天内,白度AI研究院召回了一批在外奔波的技术人员,希望逐渐将重心转移回来。但忙忙碌碌快一周,在多目标检测追踪方面完没有任何有意义的进展。

虽然最近白度AI的事业方面欣欣向荣,一片大好的局势,可不少内部的AI技术人员其实都颇有微词。

YOLO算法很强,但根本不是白度自主研发的,只是借了孟繁岐的力量做了一个大的落地项目。

短期内确实是突飞猛进,若是长期去看,却不是什么好事,真正技术上的积累还不够。

尤其一下子来了太多项目和客户,研究人员被极大地分散了精力,不少人私下里都在抱怨自己在做职责外的事情。

政府方面的新需求就是一个很好的例子,缺乏时间去沉淀技术的白度一时之间根本是一筹莫展,还是得转过头去找孟繁岐做这个需求。

王恺觉得,与其这样反复去找孟繁岐,还不如自己干脆去跟他干算了。

以他对孟繁岐技术实力的观感,创业赚大钱只是赚多少的问题,根本不存在失败的可能。

听完王恺这一系列的内情,孟繁岐其实相当能够理解,管理层很多时候的想法和决策,确实对底层员工不大友好。

因为他们没有,也不可能真的从底层员工的视角去考虑问题,说白了打工仔的想法别人压根就不在乎。

“短期内确实没有创业的想法,可能两年后会有计划。”孟繁岐单凭技术分成入股的形式就足以赚够足额的财富了,再辅之一些投资,这样会远比创业轻松很多。

如果真的要自己出来办公司的话,孟繁岐目前只有一个计划,那就是在两年后,15年底的时候和伊利亚出走谷歌,一起办OpenAI。

不过即便这件事情他也没有想好,因为在规划当中,15年前孟繁岐会把ChatGPT需要的核心技术比如注意力机制和生成式预训练Transforr都发表出来。

到时候说不定单纯技术和资本入股OpenAI就好,做个技术顾问,没必要非得自己下场创业打工。

“到时候再说吧,我如果有什么动作,不会藏着掖着的,你到时候看到了记得联系我。”

有人这么早就认定了自己,孟繁岐也愿意让他加入团队,毕竟也是白度做AI的工程师,水平上没什么问题。

只是自己短期实在没这个需求,即便有,也不大好意思把李总派来对接的人直接挖走。

结束了简短的通话,孟繁岐开始检索匈牙利算法和库恩-曼克尔斯(KM)算法,这两者其实都是老方法了。

比如匈牙利算法,就提出于1955年,是一种在多项式时间内求解分配问题的组合优化算法。

SORT多目标追踪办法也只是利用这两者,以及孟繁岐提出的YOLO,并不需要对这三者本身有很多的改变。

YOLO算法作为特征提取器,用来提取所有的车辆部分。

匈牙利或者KM算法,对相邻帧之间的若干目标进行最大匹配,卡尔曼滤波则根据目标轨迹的预测对结果进行一些修正。

尤其政府的场景当中,车辆的运动轨迹比较规则单一,这个方法的效果会相当优秀而稳定。

并且,在相邻帧中,孟繁岐还引入了IOU距离,也就是两个检测框之间交集的面积,用它作为二分图匹配的权重。

同时也能够根据帧之间的距离计算车速,并根据车速范围合理设计相关参数的阈值,可以说是一举两得了。

在这个基础之上,还有改进版的DeepSORT,这个方法是从行人的识别中获取的灵感,通过对比两个隐藏层参数向量的距离来判断两者是否是同一个人。

不过孟繁岐并不准备那么周到,实现那么多,达成了基本需求就足够了。这部分继续改进的内容,他只打算写下一个思路在这里给白度。

时间还是用在谷歌上面比较划算。