您当前的位置:首页 > 发表论文>论文发表

研究字节跳动论文

2023-03-08 15:27 来源:学术参考网 作者:未知

研究字节跳动论文

协同创意。抖音短视频广告策略研究论文的选题方向是协同创意理论概念综述,论文类型是营销传播。抖音,由字节跳动孵化的音乐创意短视频社交软件。该软件于2016年9月上线,是一个面向全年龄段的短视频社区平台。

数十位国内AI大牛参与的论文被指严重抄袭,哪些地方有抄袭嫌疑?

数十位国内AI大牛参与的论文被指严重抄袭,哪些地方有抄袭嫌疑?下面就我们来针对这个问题进行一番探讨,希望这些内容能够帮到有需要的朋友们。

北京智源人工智能研究院回复谷歌脑部的知名生物学家NicholasCarlini对一项中外合资大中型学术研究论文因涉嫌抄袭的控告称:“大家早已注意到对《ARoadmapforBigModel(关于“大模型”的路线图)》一文的怀疑,已经对有关情形开展核查,智源研究院激励学术研究自主创新和学术论坛,对学术造假零容忍,相关进度将尽早通告。”

先前4月8日,这篇数十位国内AI大神参加论文被指比较严重抄袭,NicholasCarlini公布发文,控告一篇于2022年3月26日发表在论文预印网址Arxiv的论文《关于“大模型”的路线图》(ARoadmapforBigModel)一文因涉嫌比较严重抄袭。

该文是不久前世界各国好几家高校和公司互相配合的将近200页的学术研究具体描述论文,有高达100名作者,各自来自于清华大学、北京大学等国内高校,哥伦比亚大学、蒙特利尔大学等海外高校,巨量引擎、华为、京东、腾讯等公司及其中科院和北京智源等组织。

NicholasCarlini在文章内容《机器学习研究中的一个抄袭案例》(“ACaseofPlagarisminMachineLearningResearch”)中则详尽例举了该论文存有一大段抄袭别的论文的行为,直接证据是规模性的文字重合,疑是被抄袭的论文也包含他自己的论文“DeduplicatingTrainingDataMakesLanguageModelsBetter”。

先前3月31日,北京智源社区发文以《如何炼大模型?200页pdf100+位作者19家单位!北京智源清华唐杰等发布》详细介绍该篇论文:“伴随着以深度神经网络为象征的AI技术应用的迅速发展趋势,智能化模型的练习运用方式慢慢由‘大炼模型’向‘炼大模型’变化。

大模型科学研究在近些年进步快速,模型的参总数以令人吃惊的速率拓展。北京智源人工智能研究院近期公布的《ARoadmapforBigModel》由禅悟大模型科学研究项目经理,智源学术副院长,清华大学计算机系专家教授唐杰带头,从大模型基本资源、大模型搭建、大模型核心技术与大模型运用探寻4个方面考虑,对15个实际行业的16个有关主题风格开展全方位详细介绍和讨论。十分需要关心。”

智源道歉,百余大佬署名AI论文被爆抄袭

2022年4月,一起AI界的学术不端事件可谓是“引爆 ”了整个学术圈。涉及到的100位作者,无一不是业内大佬。

谷歌大脑(Google Brain)团队著名科学家Nicholas Carlini 发表的一篇博客中指控:由北京智源人工智能研究院团队牵头,刊登在论文预印网站Arxiv的一篇中国学术综述论文《关于“大模型”的路线图》(“A Roadmap for Big Model”)一文涉嫌严重抄袭。

Nicholas Carlini在博客文章中则详细列举了上述中国团队论文存在大段抄袭其他论文的嫌疑,证据是大规模的文本重叠,疑似被剽窃的论文也包括他更早发布的《去重训练数据使语言模型更好》(Deduplicating Training Data Makes Language Models Better),部分内容一模一样。讽刺的是,后者这篇被抄袭的论文,研究的主题正是数据去重和查重。

资料显示,北京智源人工智能研究院为依托北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建的新型研究机构。

这一篇本意尽可能涵盖国内外关于该领域所有重要文献的综述报告,由智源研究院牵头,负责框架设计和稿件汇总,并邀请国内外100位科研人员分别撰写16篇独立的专题文章,每篇文章分别邀请一组作者撰写并单独署名,共200页。

值得注意的是,联名撰写的这近一百来位作者,分别来自清华、北大、上海交大等顶级名校,及腾讯、华为、京东、字节跳动等互联网大厂。

随后,北京智源人工智能研究院在其官网发布了关于“A Roadmap for Big Model”综述报告涉嫌抄袭的致歉信,确认部分文章存在问题后,已启动独立审查,并进行相关追责。

不过不过,Carlini同时也指出,涉嫌抄袭的可能只有小部分作者,在尚未明确多名作者的具体责任前应理性看待,。而且智源研究院决定立即从报告中删除相应内容,并且对报告修订版提交arXiv进行更新。目前已通知所有文章的作者对所有内容进行全面审查,后续将严格审核后再发布新版本。

智源研究院表示,将深刻吸取教训,整改科研管理和论文发表流程,并进一步完善制度管理。

这件事在知乎讨论也从第一天最初的几万浏览量,飞涨到了现在的600多万。

对此,我们可以引用知乎用户、伦敦玛丽皇后大学学子“谢圜不是真名 ”的一句话来进行总结:“ 学术声誉的建立是一辈子的事情,然而要推倒只需要一瞬间。”希望通过更加严格的审核机制和更加明确的惩戒措施,加强学风教育,防范同类事件的再次发生。

【Pete聊产品】字节跳动的管理哲学

字节跳动目前能够数得上名字的、有App的、已经形成业务的产品有20个。一家成立8年的公司旗下的20个产品一经推出,就有很强的市场竞争力,这确是爆款时代的典范。这8年来,字节跳动也从几十人成长到了六万人,本文和大家一起来聊聊字节跳动的管理哲学。

有人研究了字节跳动这家公司以后,发现一个很奇怪的现象:这家公司没什么管理。

六万人的公司没什么管理,那岂不是乱成一锅粥吗?

诚然,字节跳动就是处于这样一种失控的状态。不过正如庄子的无为一样,字节跳动在用一种无形的力量来管理公司。具体可表现在以下几点。

OKR管理是英文的“目标”和“关键结果”的缩写词,即Objectives and Key Results。首先是目标,然后是关键的结果。OKR作为一种管理工具,起源于英特尔,发扬光大在Google,现在在全世界,主要是互联网高科技公司中推行。

德鲁克曾说,真正的管理不是管理者在管理,而是由目标来管理。

很多公司管理的混乱不是因为没有管理者,也不是因为没有管理制度,而是它的目标特别不明确。当没有明确的目标时,所有人的忙碌就成了表演工作的舞蹈,从事忠诚的竞赛。其结果也是非常差的。所以真正的管理叫MBO,即Management By Objective,就是由目标来管理。

OKR继承的正是这样的思路,通过很明确目标牵引着员工激发自动能,而非每日无所事事。使用OKR就是用无形的、看不见的手来管理,而不是用看得见的手、看得见的等级、看得见的制度来管理。

说回字节跳动,张利东是刚刚被任命的今日头条中国CEO,有一个关于他的小故事。

有一次,他要到印度去考察印度市场,去了以后在海关被拦截了,因为他的签证有问题。张一鸣打电话给他的时候,以为他已经在印度了,他说我就在办公室,因为我被拦截了。

又过了一个星期,张一鸣再给他打电话,他说他在印度已经跑了好几个地方了,已经谈了好几个合作了。

他是怎么做到的呢?不管。这就是字节跳动的无为管理,目标和关键结果才是受到重视的。

因此笔者很惊讶于字节跳动有一个很多公司都不敢做的事情,那就是没有考勤。

字节跳动还有一个公司文化,深深影响着员工,那就是去等级化。就是说字节,大家都不准叫什么总,甚至不能叫什么老师,所有人都是直呼其名。

听起来是不是有些没有礼貌?实则不然,现如今越来越多的公司都在努力从称谓、头衔上着手,来改变一个公司的管理文化和管理结构。

很早联想就做过这样的努力,杨元庆在他的公司,所有人都叫他元庆,不能叫杨总。阿里巴巴在这方面可以说走得更远。用花名去代替等级、头衔,增加了趣味性,拉近了人与人之间的距离。

而字节跳动做得更极端,干脆所有这些都不要,就是直呼其名。很多公司的文化都是写成标语挂在墙上的,但是在这个公司里头,你只要一走进这个公司,你就能感受到这种平等的、去头衔化、去等级化的文化。

字节跳动有一句口号,叫“Context, not Control”。Context就是语境、上下文、场景。

笔者去年在一家小外企工作时,我们工作沟通上最难的事情就是没有context,没有语境的背景,沟通的难度不是可以轻易描述的随之而来的甩锅那都是家常便饭,而作为产品的我们,过呢更多时候承担的就是背锅的这一壮举。忍无可忍之后,我也是全身而退,实在是不适合在这种混乱的到处没有context的会议与工作中摸爬滚打。

所以当我第一次了解到字节跳动的这句口号时,真的是感同身受。Context,No Control是一种至上的管理哲学与公司文化,这也就解释了为什么有人说字节跳动没有管理,实际上它不是一个自上而下的设计和控制,而是一个自下而上的演化和生长。

这可以说是字节跳动快速成长的一个很重要的原因。有人说腾讯在爬行,字节在跳动,笔者认为动力就来自于这种“Context,not Control”。

这一部分要从大家熟悉的字节跳动推出的飞书聊起,飞书英文叫Lark,意思是百灵鸟、云雀,还有一个意思就是玩游戏。这款管理软件,虽然看上去不太像管理软件,而是带有一定的游戏色彩。但其最大的特点,字节赋予它的定位是沟通和协同的效率。

在此笔者不聊其与钉钉的竞争,多表其从0到1过程背后蕴含的商业意义,后期会出文客观分析其市场表现以及与钉钉竞争中出现的疲软等等。

飞书1.0是在2017年7月上线,三个月后,在字节内部推广使用。不到两年,2019年6月,飞书正式变成一款产品,携带着字节跳动的基因,在资本市场乘风破浪。

类似于飞书的情况在字节内部并不唯一,至于为什么一个内部使用的软件能实现商业化,为什么京东的京Me仍然是在内部使用未推广市场,下面让我们探究下其背后的能力和业务。

作为一个人,作为一个组织,我们的能力和资源都可以分为显性和隐性。能力可以分成显性能力和暗能力,资源也可以分成显性资源和暗资源。这种隐性的能力和资源常常是无价的。因为第一,由于不进入交易,它就没有明确的价格;第二,它蕴含的价值是难以估量的,所以也是无价的。下面举个例子。

波拉尼悖论告诉我们,我们知道的永远多于我们知道自己知道的,我们会的要大于我们知道我们会的。

例如,我们今天都在使用互联网,你有没有想过这是谁发明的?好像1969年美国的国防部就发明了这种东西。实际上那个东西用处不大,它只是把各个局域网连接起来,最大的功能基本上就是发电子邮件,它没办法浏览网页,没办法迅速地从一个局域网切换到另外一个局域网,从一个站点切换到另外一个站点。它就相当于一根信息专线,我们普通人是用不上的。

我们今天能够用得上互联网要归功于一个人,这个人叫伯纳斯·李。

他是个物理学家,在瑞士的欧洲物理研究所工作。除了研究物理之外,他的计算机技术也不错。他工作的机构是一个半虚拟的机构,每年都有一些人在这个地方从事研究,但是过了一段时间他们又回到各自的地方。所以这个研究机构有一个很重要的任务,就是要迅速地跟所有编外的研究员们联系。这里头查名片、查联系方式就变成了一个很重要的事,但是很长时间也没有谁想到去改进这件事的流程。

伯纳斯·李为了自己能联系得方便,就做了一些小的发明,他认为是小的发明。他发明了两项技术,一项技术就是所有的局域网互相连接,这个局域网里头的某一台计算机能够自由地跟另外一个局域网的某一台计算机连接,他把它命名为World Wide Web,缩写就是WWW;还有一个技术就是超文本传输协议,同样也是要解决局域网之间的个体终端自由切换的问题,其实就是自由地浏览,超文本传输协议的缩写就是Http。

在1991年,就是因为这两项技术,过去的Internet才成了后来的万维网,互联网才正式出现。

有人估算了一下,伯纳斯·李要是收取专利费的话,他应该是一个万亿级的富翁。当然他后来得了一笔奖金,10万美元,但他把奖金给捐出来了,因为他觉得自己是顺手做出来的。

这个例子就说明每一个人的能力之外,可能有一些隐性能力,这种能力由于没有用于交易,所以它就变不成一种业务。它的首创成本很低,但是它的最终效用可能很高。当然,也有可能它就淹没在那了,如果没有场景、没有应用,它就没有任何经济价值。

我们都在说我们步入了云时代。全球的云产业现在有三大巨头AAA,即亚马逊(Amazon)、阿里巴巴(Alibaba)和微软(Microsoft)。(微软的云叫Azure cloud)

阿里巴巴为什么能够做阿里云?在相当程度上,它做云所需要的能力和资源,在它没想到做云之前已经开始做了,而且已经初见成效。在类似于双十一的交易高峰,为保证稳定,其整个后台支持网络必须要非常强大,但过了峰值以后,该项资源和能力变得有些闲置,而多余出来的资源和能力,就有可能形成某种市场进行交易。事实上,支付宝和阿里云都是为了解决内部问题应运而生的,但是这种精益求精的隐性业务在增长到一定体量时,向市场公开化,无异于王者般降临。

微软也是一样,用了四年的时间,从一个市值2000多亿美金的公司达到超过一万亿美元,再一次成为市值最高的科技企业,依靠的就是他的云业务。

在失去PC端时代的十年里,微软在做一件事情,刚开始是无意识的,后来有意识地做一件事情,那就是云业务。微软现任的CEO萨提亚在他的自传里说:“云业务让我得到了一系列以后要谨记在心的教训,其中最重要的一条是,领导者必须同时看到外部的机会和内部的能力与文化,以及它们之间的所有联系,并在这种洞察变得众所周知之前率先反应,抢占先机。”

从隐性业务变成一种显性业务,一方面它是自然生长出来的,但是另一方面,有了种子并不意味着就有好收成,这中间也要付出很多的努力。这种隐性能力、隐性资源作为种子能力、种子资源,需要花很大的精力去播种、去培育、浇水、施肥,这样隐性业务才能变成一种真正在别人看来节外生枝突然冒出来的业务。

这就是所有的创业以及成熟企业开展新业务的时候,一个共通的规律:一个新的东西并不是全新的,表面上看是从0到1,了解的人知道,它实际上是从1到N,至少是从0.5到1,然后再从1到N这样一个过程。用萨提亚的话说,在这一种洞察都不成为众所周知之前,你已经开始在做这件事情了。

最近流行一种说法,叫打造第二曲线。根据吴伯凡老师的观点,现在有好多企业所谓的培植第二曲线有两个致命的弱点:

第一是,它所谓的第二曲线是一种众所周知的洞察,其实已经不能叫洞察了。看到有机会了,我再开始打造这个业务,这个时候你一切都是从零开始,也很可能永远实现不了零的突破。

第二,最致命的是,很多公司开始所谓的培植第二曲线,都是在公司现有的业务不行、已经开始走衰的情况下,想着再开辟一条新的业务。

而隐性业务的特点是,它就在你从事核心业务,想把它做到极致的时候,你无意当中就已经具备了那些资源和能力。探索型的经营方式,用贝佐斯的话说叫彷徨型的战略。它对一个东西、一个业务是怀着试错的态度,尽最大的努力,哪怕是获得比较小的回报,甚至长时间不盈利,只要能够保持公司的运行,也要坚持下去。

坚持了别人坚持不了的或坚持不住的,你就赢了,字节跳动再一次证明了这个结论。

最后,让我们再回看字节跳动,字节今天的业务形态有点近似于独步武林,一个公司产生那么多的业务,过一段时间又会产生新的业务,它不是第二曲线,它具有的是一种产生隐性业务的机制。这种机制跟这家公司核心的经营哲学有密切的关系。这种经营哲学用张一鸣的话说,叫推迟满足感。

《少有人走的路》中提出了“推迟满足感”这个概念。

推迟满足感包含两个方面,首先,你可以得到的好处,你不急于去获取,你是有节制地使用你的优势和好处;第二,不是马上有回报、有好处的,你也要去做。

张一鸣从创业开始,他就一直强调推迟满足感,我们以为这是心灵鸡汤,其实它是一种企业的经营哲学。

在刚刚创立不久,字节就已经显示出很强的增长性,有人下大注来投资但遭到了张一鸣的拒绝。他认为一个公司最重要的是让可能性保持得足够大,然后现实性,也就是变现的东西,要尽可能地节制,尽量地少。

感谢你读到这里,下一期让我们聊聊豆瓣的产品出圈。

相关文章
学术参考网 · 手机版
https://m.lw881.com/
首页