88. 亲历"投毒"文化,开会合影被开除?准备直播起诉 (嘉宾:大一本科生)
Watch it on Youtube. Or listen on your favortie podcast app.
Show note
欢迎来到新一期的“李丁聊天室”!
本期节目,我们请到了UP主“大一本科生”,他将亲述自己在TikTok(字节跳动)的离奇遭遇。他不仅揭秘了公司内部为了抢夺资源和绩效而诞生的“投毒”文化,还谈到了“实习生投毒”事件的更多内幕,以及神秘的“锦衣卫”HR部门。刚休完产假,竟因为在ICML学术会议上和粉丝合影而被字节跳动“被离开”?
嘉宾:大一本科生 https://space.bilibili.com/3546587376650961/ https://www.youtube.com/channel/UCcw-kSb-J1EW1jq07IGMs7g/videos
嘉宾目前已准备起诉公司,这可能是你今年听过最“大”的瓜!
00:00 欢迎嘉宾:大一本科生 01:08 离奇被裁:ICML合影风波 07:49 字节HR的巨大权力 10:25 加入字节竟是为了“吃瓜” 11:15 深度揭秘:字节“投毒”文化 19:35 在字节做研究 = 互相举报? 25:05 准备起诉:为什么觉得能赢? 29:58 字节的“锦衣卫”是什么? 32:30 嘉宾在字节的具体工作 36:34 为什么大家还想去字节? 38:11 给研究生的建议:该Quit PhD吗 47:56 总结与祝福
关注我们: https://lidingzeyu.com/podcast/subscribe
如果你喜欢本期节目,请不要忘记点赞、订阅并分享给你的朋友!也欢迎在评论区留下你的想法和问题。
李丁的联系方式:
- Signal (+1) 206-745-2849
- 邮件 [email protected]
- Whatsapp (+1) 206-745-2849
- Youtube 留言:https://youtu.be/fKiLyoNnOMM
- 微信 ID 是 "李丁泽宇" 的拼音
联系李丁来聊聊天啊!
制作团队
- 李丁泽宇 (https://dingzeyu.li)
Full transcript text
(AI 生成的文字稿,可能有错误,请自行分辨)
- 00:00 欢迎大家来到新的一期李丁聊天室
- 00:01 今天我们请到另外一位UP主
- 00:03 叫做大一本科生
- 00:05 来分享他关于研究的一些见解
- 00:08 然后大一本科生也是在业界做过多年研究经验的
- 00:12 方便跟大家自我介绍一下吗
- 00:14 感谢李丁邀请我到李丁聊天室
- 00:18 之前看你节目我也看了很久了
- 00:21 觉得你们这个节目还是分享了很多有趣的干货的
- 00:24 然后我简单做一下自我介绍吧
- 00:27 我之前是在北美这边读的
- 00:30 就是本科还有博士
- 00:32 然后后来去Princeton
- 00:35 然后高研中心待了两年
- 00:36 然后过去几年一直在工业界
- 00:39 就是做一些研究员的工作
- 00:42 主要是在我是那个
- 00:44 就是那个前Adobe员工
- 00:46 也是那个前那个字节跳动
- 00:48 TikTok的员工
- 00:49 然后今天给大家主要分享一些
- 00:51 就是关于大厂研究的一些经验吧
- 00:53 然后一些分享
- 00:55 OK对挺好的
- 00:57 对欧版你你在这两个厂
- 00:59 其实是挺有代表性的
- 01:01 这个在北美很多想要做
- 01:02 在业界做研究的同学
- 01:04 都会感觉这是两个挺有意思的一个
- 01:07 就是公司
- 01:08 那你可以分享一下
- 01:11 比如说你现在都不在这两个公司了
- 01:13 那你离开这两个公司的时候
- 01:15 分别大概是有什么样的一些原因
- 01:17 或者思考呢
- 01:17 字节呢
- 01:19 这个为什么离开的
- 01:21 这个原因就
- 01:22 就说出来
- 01:23 就是就有点离谱了
- 01:25 我也有
- 01:25 其实到现在为什么
- 01:26 就是我被离开了
- 01:28 我也不知道啊
- 01:29 然后就是
- 01:31 就是这样的
- 01:33 就是我
- 01:34 呃
- 01:35 就是起因是我今年去开了个ICML
- 01:38 然后很多我的
- 01:39 那个粉丝呢
- 01:41 找我合影
- 01:42 然后合影之后呢
- 01:44 我就被离开了啊
- 01:48 就等于说字节不希望他的员工
- 01:50 有这种社交媒体上的
- 01:52 的太大的影响力吗
- 01:53 还是为什么照完相
- 01:55 你就被离职了
- 01:56 就是我没有收到任何的
- 01:59 就是原因关于这个事
- 02:03 就是就是关于这个书面的解释
- 02:04 然后为什么
- 02:05 就是具体我违反了哪一项规定
- 02:08 或者说
- 02:09 就是我没有收到任何这样的东西
- 02:12 就是而且
- 02:12 就是我其实
- 02:14 我其实NeurIPS的时候呢
- 02:16 就是
- 02:17 我就是本来是不想去的
- 02:19 但是我的加一就是
- 02:21 因为别的公司的manager
- 02:23 自己也叫加一加二
- 02:24 就是你的加
- 02:25 你的manager
- 02:25 我们原来加一
- 02:26 就我的加一想让我去
- 02:28 然后想让我帮忙
- 02:30 就是招一些人可能
- 02:31 然后觉得
- 02:32 可能觉得他是意思
- 02:34 觉得我可能有一些影响力
- 02:35 然后就让我去
- 02:35 然后我去了之后呢
- 02:37 其实他们一开始也没想到
- 02:39 我也没想到
- 02:40 很多人会来找我合影这个事
- 02:41 就很多很多人找我合影
- 02:43 然后后来他们也就开玩笑的
- 02:44 默认了这件事情
- 02:45 甚至就是说
- 02:47 字节内部的员工
- 02:49 也有人找我合影
- 02:49 就是包括就是
- 02:51 不管是Seed的
- 02:52 还是我们组的
- 02:53 还是别的组的
- 02:53 都有人找我合影
- 02:54 就没有这个事
- 02:55 没有任何问题
- 02:56 看上去
- 02:56 然后
- 02:57 然后NeurIPS之后呢
- 02:59 我女儿出生
- 03:00 我就在休产假
- 03:01 然后我休完产假之后呢
- 03:04 我就去开了个ICML
- 03:05 开完之后呢
- 03:06 我就被字节
- 03:07 被离开了
- 03:08 然后就是
- 03:10 我不知道具体是为啥
- 03:13 就是我现在没有说到具体的原因
- 03:14 因为
- 03:15 因为我感觉就是
- 03:16 同样的事情在
- 03:18 在NeurIPS发生过一次
- 03:19 然后
- 03:20 我也不知道为什么
- 03:21 就是ICML这次就发生了
- 03:23 就是我听说是因为就是说
- 03:26 当时那个就是开NeurIPS的时候
- 03:30 不是每个公司会运一个自己的衣服吗
- 03:32 然后你就要穿那个工服
- 03:34 在那展台布展站着吗
- 03:35 但是当时那个衣服呢
- 03:37 上面印的是字节跳动
- 03:38 但是呢
- 03:39 这次开ICML的时候
- 03:40 所有的衣服呢
- 03:41 都印成了ByteDance Seed
- 03:42 就是即使你不是Seed的组人
- 03:45 你也只能穿那个衣服
- 03:47 因为那是唯一字节的衣服
- 03:48 然后就是我猜测的一个可能是
- 03:52 因为我穿的那个衣服呢
- 03:54 就是可能觉得
- 03:57 Seed的人觉得我穿他们的衣服
- 03:59 然后但我又不是Seed的人
- 04:01 然后可能造成了一些
- 04:03 就是confusion还是什么的
- 04:04 但是我也不知道
- 04:06 就是我到底犯了何罪
- 04:10 然后就是反正现在
- 04:12 我就后来就被公司那啥了
- 04:14 然后我接下来打算
- 04:15 就是找律师来告公司了
- 04:18 那所以那你们字节离职
- 04:20 比如说你的manager
- 04:22 你的加一也不会跟你说原因
- 04:24 反正就是你拜拜了
- 04:25 就是你加一
- 04:26 对
- 04:27 就是我可以跟你说一下
- 04:29 就是就是字节跳动之前的一些情况
- 04:32 类似的情况
- 04:33 就当然了
- 04:34 就是我之前是有人真的做了一些
- 04:36 你可能听说就是之前有个叫HR保姆
- 04:39 就是那个他让他妈去当保姆
- 04:40 那个事
- 04:41 那个是字节的一个女的HR
- 04:43 他让他妈去当保姆
- 04:44 后来他妈跑路回国了
- 04:45 然后还有一个人
- 04:48 还有一个字节员工叫乔木
- 04:50 他和另外一个HR呢
- 04:52 就是那个HR是他的小三
- 04:53 他就在公司里做了些洗钱的事情
- 04:55 还是怎么回事
- 04:56 具体我也不知道怎么回事
- 04:57 但这两个人的情况
- 04:59 当时就是他们账号呢
- 05:00 立即变成unavailable
- 05:01 然后过一段时间就close了
- 05:03 然后我的账号呢
- 05:06 就突然有一天
- 05:07 就是我从
- 05:07 我从就是
- 05:10 就是ICML回来之后呢
- 05:13 然后就是一开始那周呢
- 05:15 我加一跟我说了两次这个事
- 05:17 我加一也说这个事情不是很大
- 05:19 然后但是
- 05:20 不知道突然有一天
- 05:21 然后有一个HR
- 05:22 就来跟我说
- 05:24 那个我的账号呢
- 05:25 要暂停使用
- 05:26 然后我就带薪休假了
- 05:27 然后之后呢
- 05:30 我就在可能上周
- 05:31 我就收到了一个
- 05:32 一个邮件
- 05:34 就是一个邮件
- 05:35 反正就是说
- 05:35 那个可能我就拜拜了
- 05:37 所以非常最近的
- 05:39 非常最近的事情
- 05:40 就是最近
- 05:41 就是非常最近的事情
- 05:43 所以我们
- 05:44 你当时约我录节目的时候
- 05:45 你还没有这些
- 05:46 这些八卦的事情出来的
- 05:48 因为我们约了
- 05:50 很早了
- 05:52 就一两个月了
- 05:53 因为我是因为各种原因
- 05:54 一直在拖
- 05:55 然后
- 05:55 对对对
- 05:56 当时我也有点
- 05:57 对对对
- 05:58 因为我当时约你的时候
- 06:00 那会儿应该只是想
- 06:02 就是找一些UP主
- 06:03 就是因为我看了
- 06:05 你最近几个视频
- 06:06 我也看了别的
- 06:07 我想就是找一些UP主
- 06:07 然后联动一下
- 06:09 然后就是录一些视频
- 06:10 那段时间
- 06:10 只是就比较那个啥
- 06:12 当时
- 06:13 当时想来找你的时候
- 06:14 我不知道
- 06:16 就是接下来会发生这些事情
- 06:18 我当时只是以为
- 06:20 就是说我穿了那个衣服
- 06:22 然后可能跟学生拍照了
- 06:24 不太好什么之类的
- 06:25 然后我不知道
- 06:26 接下来就是
- 06:28 就是我的工作都没了
- 06:30 然后就是我就瞬间就变成了
- 06:31 那个也没有保险了
- 06:33 主要我女儿刚出生
- 06:34 然后我现在还得给她弄个保险
- 06:36 这个就比较tricky
- 06:37 然后他们约等于是在我产假期间
- 06:40 将近把我那个啥了
- 06:41 现在
- 06:41 OK
- 06:42 对
- 06:43 所以我现在也不明白
- 06:45 他们是
- 06:45 他们也有可能是产假期
- 06:48 我也听说有公司
- 06:49 就是说觉得你放产假了
- 06:50 然后就
- 06:51 你放产假
- 06:53 后来把你找了
- 06:54 把你开了
- 06:54 对吧
- 06:55 这也是非常有可能
- 06:56 所以这个事情
- 06:57 可能只是trigger一些事情
- 06:58 我也不知道
- 06:59 我没有获得任何的
- 07:00 就是实质性的文件和证据
- 07:02 告诉我
- 07:03 我到底犯了什么错
- 07:04 我犯了条天条
- 07:05 我需要被开除
- 07:06 或者说我需要被开掉
- 07:07 我现在没有任何的sense
- 07:08 没有任何information
- 07:09 我是可能
- 07:10 两天前还是三天前
- 07:12 我收到那封最新的邮件
- 07:13 说我已经拜拜了
- 07:16 然后我让一些朋友
- 07:17 帮我看了我内部的账号
- 07:18 我现在账号已经显示close了
- 07:19 OK
- 07:21 OK
- 07:22 那所以你现在其实还属于
- 07:24 这个在现在这个
- 07:26 一片混沌的状态中
- 07:29 去
- 07:29 想找到一些信息的这种感觉
- 07:33 这个可能律师找就可以了
- 07:37 我只要付律师钱
- 07:38 然后我现在主要找律师
- 07:39 对
- 07:39 我觉得律师负责从这个
- 07:41 从这个
- 07:42 这个混沌的状态中
- 07:43 找到一条就是比较合法
- 07:45 或者合理的
- 07:46 可以告他们的理由
- 07:46 对
- 07:47 我也不知道
- 07:51 这个事情是某些HR
- 07:54 就把这个事情决定了
- 07:55 还是一些高层的领导
- 07:57 因为据我所知
- 07:58 字节的HR权力很大了
- 08:00 他们是可以不经过一些人
- 08:02 做一些事情的
- 08:03 我感觉很有意思
- 08:05 因为我这个节目
- 08:06 我做了这么多期
- 08:07 其实只聊过两期
- 08:08 关于字节相关
- 08:09 这是第二期
- 08:10 第一期是可能几年前了
- 08:12 可能两三年前
- 08:13 有一个我一个朋友
- 08:15 他也是上字节
- 08:16 当时离职了吗
- 08:17 要么就准备离职
- 08:19 要么就是刚刚离职
- 08:20 他也是来吐槽了
- 08:22 字节的一些加班文化
- 08:23 当时是应该在疫情期间
- 08:24 聊加班文化的东西
- 08:26 然后聊完之后
- 08:27 也是他的加一还是加二
- 08:28 还是什么什么
- 08:29 就加几不知道加N了
- 08:30 然后跟他聊说
- 08:31 你必须马上把这个节目下架
- 08:32 不能够在公开场合
- 08:34 讨论字节的
- 08:35 这个某些文化方面的东西
- 08:37 然后他就跟我说
- 08:38 我们能不能下架
- 08:38 然后我就帮他全下架了
- 08:40 他当时是还在公司是吧
- 08:42 我记得好像是
- 08:43 他刚刚是
- 08:44 他本来是北美的
- 08:46 然后他要回国了
- 08:47 然后就疫情期间
- 08:49 就被困在国内
- 08:50 我觉得只要你不慌
- 08:52 我也不慌
- 08:52 他们现在要是来
- 08:53 他们最好也来告我
- 08:54 我跟他互相告
- 08:56 反正他们告我的
- 08:57 所有接下来的状态
- 08:58 都将在网上直接进行直播
- 09:00 我将成为第一个告字节
- 09:02 然后并且直播告字节的人
- 09:03 我昨天有时候
- 09:04 开一个小红书账号
- 09:05 你知道吗
- 09:05 我现在准备养那个小红书账号
- 09:07 养到我有一批数量的粉
- 09:08 我还关注你
- 09:09 养到我有一批数量的粉丝
- 09:10 我在小红书上直播告字节
- 09:12 我今年就才去
- 09:13 去他们展台跟他们聊天
- 09:16 那看看我们这个第二期
- 09:18 跟字节相关节目
- 09:19 会不会最终也被下
- 09:20 就是我觉得
- 09:21 对
- 09:22 其实是后来后来下架的原因
- 09:24 是因为那个我的朋友
- 09:25 他他怕自己的各种
- 09:27 retaliation
- 09:28 各种打击报复
- 09:29 所以后来他就让我下架
- 09:31 然后我就下架了
- 09:31 那我已经我已经请了保镖了
- 09:33 而且我已经就是
- 09:34 保镖天哪
- 09:35 我我我已经我已经就是留好了
- 09:38 就是我我如果出现任何意外
- 09:40 就是所有的一些信息
- 09:43 那些视频会直接release
- 09:44 我已经做好一切的这些准备了
- 09:47 所以我才找你干这个事的
- 09:49 我没有想到我们这个节目
- 09:50 一开始就这么的
- 09:51 这么的intense
- 09:52 就像一个在电视剧才会发生的
- 09:54 所以一开始我就跟你说
- 09:56 就是我是来找你
- 09:58 给你聊一些大字
- 09:59 OK了解了
- 10:01 现在我了解了
- 10:02 因为你看我看你
- 10:02 我们前面的提纲
- 10:04 很多都是非常比较平静的
- 10:06 什么关于
- 10:06 在大厂做研究的一些东西
- 10:08 然后我感觉这些不是特别的大的
- 10:09 本来也就是
- 10:10 本来一直在聊
- 10:12 主要我也是前两天
- 10:13 才收到这个邮件呢
- 10:14 OK
- 10:15 OK
- 10:15 行
- 10:16 好
- 10:16 那我们先
- 10:17 那你等一下
- 10:18 咱们可以聊很多题
- 10:21 咱们可以每个月
- 10:21 对
- 10:21 我也觉得是
- 10:23 每个一个月半个月
- 10:24 来看看你的update什么的
- 10:25 再来告诉你
- 10:26 为啥去字节
- 10:27 这就是另外一个瓜了
- 10:28 你知不知道去年
- 10:29 字节得了
- 10:30 NeurIPS Best Paper
- 10:31 这个事
- 10:31 我好像是听说
- 10:33 那个不是就是那个
- 10:34 那个那个
- 10:35 投毒的对吧
- 10:36 对
- 10:36 实习生投毒那个
- 10:37 你猜那个实习生
- 10:38 是哪个组
- 10:39 是不是我们组的
- 10:40 那个实习生
- 10:40 是我们组的实习生
- 10:41 OK
- 10:42 我去字节
- 10:44 就是因为我知道
- 10:45 我要去的这个组
- 10:46 那个实习生在这个组
- 10:47 所以我才去的
- 10:48 我去字节就是为了吃瓜的
- 10:51 我就是为了等有一天
- 10:54 我离开字节了
- 10:55 把这些瓜曝光
- 10:56 写本书的
- 10:57 然后你现在这些瓜
- 10:59 你感觉你在离职之前
- 10:59 得到了吗
- 11:00 现在我唯一没有想到的事情
- 11:03 就是我自己成了这个瓜了
- 11:05 我当时这个投毒的事件
- 11:09 如果别人不太了解投毒事件
- 11:11 你要简单跟大家回顾一下吗
- 11:12 对这个我觉得就说来就话长了
- 11:14 这个来来我给你们说
- 11:16 就是就是自从
- 11:17 首先我觉得投毒这个文化
- 11:19 在在那个公司是鼓励有值的
- 11:22 只是这位学生可能把它发扬光大了
- 11:24 我来告诉你
- 11:26 为什么这个东西鼓励有值
- 11:28 我觉得甚至不止在那个
- 11:29 当然你说这个东西是自己人先
- 11:32 看了还是先卖给人下班的
- 11:33 我不知道
- 11:33 这可能又把卖给这个
- 11:35 我现在也没事
- 11:36 我现在已经不打算去任何科技公司上班了
- 11:38 我已经打算在互联网上
- 11:39 就是开始干这些事了
- 11:40 所以我也不care这些事
- 11:41 我可以告诉你
- 11:44 你如果训过模型的话
- 11:45 你应该大家知道
- 11:46 大家应该都训过模型
- 11:47 就是说模型pre-training和post-training
- 11:49 pre-training你需要把checkpoint
- 11:52 然后share给
- 11:54 pre-training之后的finish那个segment
- 11:57 checkpoint share给post-training
- 11:58 OK
- 11:59 你可以这样想
- 12:01 假设一个组有两拨人
- 12:03 一拨人做pre-training
- 12:05 一拨人做post-training
- 12:06 然后有一个14天的周期
- 12:08 我们需要把这东西完成了
- 12:09 所以7天的时候
- 12:10 pre-training要finish那个checkpoint
- 12:12 给post-training对吧OK如果你想升职呢你应该做什么你不应该把这个事情完成了在字节跳动升职最快的事情是举报别人
- 12:22 这是为什么我拍了个照就会被举报的原因
- 12:24 所以他的正确的做法是
- 12:27 你应该给别人一个错的checkpoint
- 12:31 这样post-training组一定完成不了任务
- 12:39 然后你就可以举报他们
- 12:40 那你举报什么呢
- 12:42 那你的checkpoint是错的
- 12:43 你怎么举报别人呢
- 12:44 他没有发现
- 12:46 没有告诉我
- 12:47 这个时候就看
- 12:48 这个时候就看
- 12:49 吵架谁的本领强了
- 12:51 就看领导偏袒谁了
- 12:52 以及谁能PK谁了
- 12:54 因为这个事情
- 12:55 我们就说不清了
- 12:55 举报别人
- 13:00 为什么会升职呢
- 13:01 字节一定要给有些人
- 13:03 打低绩效
- 13:03 你们一个周期里面
- 13:07 互相work的人
- 13:07 互相打低绩效
- 13:08 这是必须的
- 13:10 必须要有人拿M-
- 13:11 他们有一个评级
- 13:12 就是M减M加
- 13:13 然后比如说E什么O什么的
- 13:15 一定要有人打低绩效
- 13:16 你如果
- 13:18 就比如说我给你举个例子
- 13:20 你可能对这分数没干
- 13:21 我给你举个分数
- 13:22 比例好
- 13:23 假设比如说
- 13:24 你可以比如说
- 13:26 他的规定是
- 13:27 你可以给所有人都打90分
- 13:28 对吧
- 13:29 或者你给
- 13:30 他必须让你
- 13:32 就是给一个人打80分
- 13:33 那你如果说
- 13:36 我都给所有人打100分
- 13:38 一个人打90分
- 13:38 那90分就算80分
- 13:39 就一定要拉curve
- 13:42 就不是像绝对分是一定要拉curve
- 13:43 对对他一定要拉curve
- 13:45 所以所以在字节只有有狼性
- 13:47 有野心的人才往上升
- 13:49 你怎么升得快乐
- 13:50 就是给别人下毒
- 13:51 这其实在其他很多公司类似
- 13:56 就是就是就是本账就是一种抢scope
- 13:58 就是我把你的scope抢掉
- 13:59 或者说我给你下毒了
- 14:00 让你的scope搞砸了
- 14:01 那我就可以就是吞并你这个番号什么的
- 14:04 对吧
- 14:04 就就就DeepMind不是那帮人
- 14:06 后来都不是那帮人在也叫DeepMind
- 14:08 对吧
- 14:08 他们只是继承那个番号而已
- 14:09 就是这在
- 14:10 之前那个公司的正宗也有
- 14:14 但现在就是说大模型这东西
- 14:16 你需要很多资源
- 14:17 很多卡
- 14:17 所以大家为了
- 14:19 为了抢那个卡
- 14:20 就是需要做一些这样的事情
- 14:21 这个非常常见
- 14:24 然后他那个学生
- 14:25 只是因为资源分配
- 14:27 我来跟你说
- 14:29 就是这个学生
- 14:31 他做这件事情
- 14:32 肯定是有问题的
- 14:33 不好的
- 14:33 但是你不能说
- 14:35 这个idea肯定不是他想出来的
- 14:36 就是投毒这件事
- 14:37 这肯定之前就有人干的
- 14:39 只是没有干的明显
- 14:40 当时是那个mentor
- 14:43 可能让两个学生试不同的东西
- 14:46 然后按理说
- 14:50 在学术圈
- 14:51 其实老师
- 14:51 如果是老师会怎么做
- 14:52 他会让不同学生试不同东西
- 14:54 但是两个学生都在两个文章上
- 14:56 对吧
- 14:56 这非常合理
- 14:58 对吧
- 14:58 对
- 14:59 但这不是唯一的方法
- 15:01 对
- 15:01 这是一种合理的方法
- 15:03 学术圈大概率会处死这个扭曲位
- 15:05 都做这件事情
- 15:06 但是那个mentor
- 15:08 可能没有接受过科研的训练
- 15:10 就是一个master学位的人
- 15:12 他就没有意识到这件事情
- 15:14 然后或者所以就导致了
- 15:16 这两个学生在看屁的两个方向
- 15:18 然后所以一个学生就很不爽
- 15:20 就把另外一个学生的都给投毒了
- 15:21 他们都想拿最多的卡
- 15:24 因为他们需要跑那个
- 15:25 Video Generation
- 15:26 需要那个千卡实验
- 15:27 所以你一人有五百张卡
- 15:29 他跑不起来
- 15:29 就至少有一个一千张卡
- 15:31 所以就把别人的卡
- 15:32 就把那个别人投毒就可以了
- 15:33 然后那个那个投毒事件
- 15:37 就是当时是我们组嘛
- 15:39 然后当时因为那个投毒
- 15:41 他是在infra上投毒
- 15:42 不是说在那个上层投毒
- 15:45 所以当时就觉得是infra代码有bug
- 15:47 然后就因为这个原因
- 15:48 就是我们组和infra那帮人
- 15:50 就是Seed的infra那帮人吵了一架
- 15:51 就是当时闹得很严重
- 15:53 就是一开始我们组说
- 15:54 我们组的人说Seed的人的infra有问题
- 15:57 或者Seed的infra人说我们组有问题
- 15:59 然后当时就是这样
- 16:03 然后再后来呢
- 16:06 就出现了很多很多很专门的事情
- 16:09 就是为什么这个事情会闹大
- 16:12 其实这个事情一开始也没什么人知道
- 16:14 我其实刚开始入职字节的时候
- 16:16 我也听人跟我说了
- 16:18 我甚至跟了几个群众聊过天
- 16:19 这个事情为什么会闹大呢
- 16:23 是因为字节在大陆的地方
- 16:28 有一个诚信廉
- 16:30 阳光联盟名单
- 16:31 我不知道你知不知道这个东西
- 16:32 我也是听别人跟我讲
- 16:33 它是可以做到
- 16:35 字节一定要把这个人举报
- 16:36 这个人在那找不见任何工作了
- 16:38 就像你国内的
- 16:40 就业黑名单这种感觉
- 16:43 对对对
- 16:43 就是可以封杀你一辈子
- 16:46 就在国内你再也找不到工作了
- 16:47 对对
- 16:48 因为这个学生
- 16:49 去面试任何地方都找不到工作
- 16:51 所以这个学生才出来洗白自己
- 16:52 说我其实没干那个事
- 16:54 然后字节也为了去压这个瓜
- 16:57 就把这个瓜告了
- 16:58 让他赔800万人民币
- 16:59 他其实到时候损失可能不止这个钱
- 17:02 这就是
- 17:03 但是这个瓜其实
- 17:04 他最傻逼的
- 17:05 是他没有出来开直播
- 17:06 你知道吗
- 17:08 我当时就做了一个
- 17:09 所以觉得你做的就对了
- 17:10 现在被字节开除之后
- 17:11 你觉得你现在出来开直播
- 17:12 是正确的决定
- 17:13 对对对
- 17:14 那我觉得我现在
- 17:15 我就是
- 17:15 我来字节
- 17:16 我就是来收集瓜的
- 17:17 我就是等着这一天的
- 17:18 只是没有来这么早而已
- 17:20 我还想着多收集几年瓜的
- 17:21 现在还没到一年
- 17:24 就那个
- 17:26 就是那个
- 17:26 就是那个事情发生
- 17:28 那事情过完了吗
- 17:28 这个事情
- 17:29 就是这个投毒事件
- 17:30 比如说字节去告他
- 17:31 要赔偿八百万
- 17:32 这个事情有了一个了结吗
- 17:34 还是还在法律过程当中
- 17:35 他们就是把那个案子挂在那
- 17:39 应该不会进行下去了
- 17:40 不会追溯下去了
- 17:41 就是主要那个
- 17:42 那个科宇田科宇不出来
- 17:44 接着闹事
- 17:44 他们就不会那个啥
- 17:46 那你说这个学生
- 17:48 他如果之后找不到
- 17:49 在国内找不到
- 17:49 那他的唯一的出路
- 17:50 也就是只能出国找工作了
- 17:52 不然他
- 17:53 对但是
- 17:53 但是有一些那种
- 17:55 那个啥
- 17:56 他们不能的啥
- 17:56 就是
- 17:57 就是
- 17:59 他不能出国
- 18:01 还有一些
- 18:02 你懂我意思吧
- 18:03 所以他就很惨
- 18:05 正是因为他不能出国
- 18:07 他那个学校决定他不能出国
- 18:09 所以他只能在国内找工作
- 18:11 所以只能出来洗白自己了
- 18:13 OK
- 18:14 你说不能出国是国防七子
- 18:16 这种类似的原因吗
- 18:17 什么的
- 18:18 差不多吧
- 18:20 可能
- 18:20 我也听别人说的
- 18:22 OK
- 18:23 了解
- 18:25 对
- 18:27 那
- 18:27 那你说
- 18:30 那个还有后续
- 18:33 那个就是
- 18:33 那个还有更搞笑
- 18:36 就是被投毒的学生
- 18:37 最后也被字节搞了
- 18:39 好像最后
- 18:40 就是因为被投毒的学生
- 18:43 一定要把那个投毒人绳之以法
- 18:45 然后就是因为有一段时间
- 18:47 我不知道你有没有印象
- 18:48 就是外网有一个GitHub
- 18:50 还有什么一些录音什么的
- 18:52 就是关于那个投毒的学生
- 18:54 他自己怎么投毒
- 18:55 以及投毒的学生
- 18:56 跟他加一的对话
- 18:58 你知道吧
- 18:59 就是类似这样的东西
- 18:59 然后就是那个东西
- 19:02 传言就是字节好认为
- 19:05 内部认为是那个被投毒的学生放出去的
- 19:08 反正不知道谁放出去
- 19:10 然后他们就是被
- 19:11 然后所以被投毒的那个学生
- 19:12 后来也被搞了
- 19:13 你觉得很多drama
- 19:16 对这是你想要的东西
- 19:17 这种drama也是你想要的东西
- 19:21 对这些人都是
- 19:22 这些都是我想要的东西的
- 19:22 我去那就是小老姐这些刷瓜的
- 19:24 当时
- 19:24 OK
- 19:25 当时那两个学生
- 19:28 就是这背投都两个学生
- 19:30 差点就是后来
- 19:31 本来都要入职字节了
- 19:32 后来一个去了Adobe
- 19:33 现在另外好像一个去了Meta
- 19:35 那听你的这个描述
- 19:37 好像你对于在大厂做研究
- 19:39 这个事情是很持怀疑态度的
- 19:42 因为你觉得是一个
- 19:43 互相举报的一个这个过程
- 19:45 而不是互相做好research的过程
- 19:47 我的理解对吗
- 19:48 我觉得你的理解挺对的
- 19:52 就是我的感觉是这样
- 19:53 就是你如果做那种
- 19:54 跟大模型无关的科研
- 19:55 就那可能真的还是
- 19:57 可能是比较那个啥的
- 19:59 但是如果跟大模型相关
- 20:00 就反正
- 20:03 我不好说别的公司
- 20:05 但是我就是字节里边
- 20:07 就是发生了这个之后
- 20:08 人与人之间
- 20:09 你没有信任了
- 20:10 就是你经常就
- 20:13 你就会担心
- 20:16 别人的checkpoint
- 20:16 给你下毒了
- 20:17 听起来我感觉很
- 20:22 我还在这个processing当中
- 20:24 因为这个是
- 20:24 我对我来说
- 20:24 这个非常新的一个概念
- 20:25 就我感觉
- 20:26 主要字节
- 20:30 大多数北美大厂公司
- 20:32 还是属于另外一个
- 20:34 你可以这样想
- 20:37 你觉得
- 20:38 比如说你说
- 20:40 Yann LeCun什么那些人
- 20:41 也有一些别的什么人
- 20:43 去开会拍照
- 20:45 跟学生合影
- 20:46 你听过那些公司
- 20:47 HR举报了
- 20:48 把那人开了吗
- 20:49 对啊
- 20:51 闻所未闻
- 20:53 对吧
- 20:54 那字节的HR就有这个权利
- 20:56 你知道吗
- 20:57 我看国内的HR权利
- 20:59 就是比较大一点
- 20:59 这个是我
- 21:00 就是跟我在北美工作的经验感觉
- 21:03 这边的HR好像
- 21:03 至少不会这么overstepping
- 21:05 他们有他们自己
- 21:06 其他的事情要做
- 21:07 不会来管这些事情
- 21:08 就是
- 21:09 但他们也没有权利
- 21:10 管这事吧
- 21:11 我觉得
- 21:11 他们有
- 21:14 他们就是HR不就是管理
- 21:15 这种员工的
- 21:16 生杀大权的吗
- 21:18 只是说他们
- 21:18 不会在这种事情上面管理
- 21:21 就是不会因为你照了相
- 21:22 对啊
- 21:22 他比如管理
- 21:23 如果我泄露了公司的机密
- 21:24 OK他们就要管理
- 21:25 但是如果说
- 21:25 我没有泄露公司机密
- 21:27 我只是去会议上面
- 21:28 对吧
- 21:29 宣传我们公司的
- 21:30 我的学术文章
- 21:32 那就是工作的一部分
- 21:34 对
- 21:34 而且问题是学生跟我合影
- 21:37 都在字节展台
- 21:38 我本账在帮大家宣传字节
- 21:39 我也没有理解
- 21:40 当时公司还有人
- 21:41 我抢了字节流量
- 21:43 我也不太懂是为啥
- 21:44 反正这个事情
- 21:45 我到现在我都不明白
- 21:47 为什么
- 21:48 我都没发生什么
- 21:49 但反正你说的没错
- 21:52 就是做大模型这种
- 21:54 我听说像什么meta
- 21:57 还有一些别的地方
- 21:58 也有类似的问题
- 21:59 就是组与组之间会抢scope
- 22:01 因为我们组就不是一个科研组
- 22:08 我们组本来是产品组
- 22:10 然后只是恰好
- 22:11 我是个做科研的人而已
- 22:13 然后我知道其他的公司
- 22:15 也有类似的情况
- 22:15 就是产品组
- 22:16 为让自己能生存下去
- 22:19 因为他们能产生revenue
- 22:21 就是比如广告组
- 22:22 他们就会跟领导claim
- 22:24 自己也想做一些战略
- 22:25 要些卡
- 22:26 然后就跟别的公司
- 22:28 就跟别的组进行那个compete
- 22:32 就是可能有一个正儿八经的
- 22:34 做research组
- 22:35 但这个research组的卡
- 22:36 可能没有那个
- 22:37 产品组卡多实际上
- 22:39 所以就变成了
- 22:41 两边做一样的东西
- 22:41 然后做internal
- 22:42 就是他们
- 22:43 他们公司可能很难
- 22:46 让你不赛
- 22:47 但是他们就在赛
- 22:48 然后赛完之后
- 22:49 可能就会存在
- 22:49 一个把另外一个吃了
- 22:51 就是类似这样的问题
- 22:52 然后如果不吃对方
- 22:55 就是一个人做上
- 22:56 一个人做下
- 22:56 有两个就肯定会互相
- 22:57 有一边会投毒
- 22:58 这是必然的
- 22:59 你不投毒
- 23:00 就是蠢
- 23:01 我只能说
- 23:02 你要是不想往上爬
- 23:04 你往上爬
- 23:05 你就应该下毒
- 23:06 你不下毒你就蠢
- 23:07 你就不适当领导
- 23:08 那你觉得
- 23:11 这是为什么会有这种投毒的现象
- 23:14 就是怎么
- 23:15 比如说你要fix
- 23:16 这个投毒的这种现象
- 23:18 有什么方法吗
- 23:19 还是说这已经无解了
- 23:20 首先我觉得在我工作中
- 23:24 我没遇到过这种事情
- 23:25 所以我对完全不知道这个东西
- 23:27 我还没有完全理解
- 23:28 这个incentive为什么会在
- 23:30 对因为Adobe不会
- 23:32 就是一定要有人背低绩效
- 23:34 这个事
- 23:36 然后字节是有这个是要求的
- 23:39 那你这样说
- 23:41 其实最近这几年
- 23:42 有很多北美大厂也是这样子
- 23:44 比如说什么meta
- 23:45 google好像也都有这种
- 23:46 必须有一定比例的员工
- 23:47 是低绩效的
- 23:49 对主要我也没在那些厂
- 23:51 我原来那些厂实习过
- 23:53 所以我也不清楚
- 23:53 他们那就是是否会就是搞深到
- 23:56 就是会下毒这个事
- 23:57 但是在字节这个已经应该是个祖传手艺
- 24:00 已经传了很多代了
- 24:01 只是被科宇发扬过大了而已
- 24:03 就是根据我对科学的话理解
- 24:06 绝对不是科宇
- 24:07 你想下毒这么巧妙的事情
- 24:09 绝对不是你拍脑子想出来
- 24:11 一定是你见过一些类似的东西
- 24:13 然后把它彻底发扬过大了
- 24:15 我觉得
- 24:15 OK
- 24:18 我也不知道应该怎么fix但反正它确实阻止人类实现AGI了
- 24:25 可能因为下毒晚实现了AGI几年吧
- 24:29 字节还有一些搞笑的事情就是字节Seed的那些文章里面明明很多人干了活很多人不在上面每个领导领导只能放自己几个嫡系在上面我也不知道为啥我不知道是谁决定的反正这也是一个非常霸道的事情
- 24:39 因为有些人跟我说了这个事
- 24:41 这个我在小说上看到过好多了
- 24:43 不仅字节
- 24:44 好像国内好多厂都是这样
- 24:45 腾讯也有很多
- 24:46 华为也有很多这种的
- 24:48 对
- 24:49 然后
- 24:53 我现在脑子一片空白
- 24:57 因为就之前
- 24:58 你的这个大瓜让我还在震惊当中
- 25:01 你可以接着问我
- 25:03 我记得问你瓜的一些细节
- 25:05 比如说
- 25:05 你现在说你找律师要告
- 25:08 告字节
- 25:10 你的大概的原因
- 25:12 能告他的点是什么呢
- 25:15 是在你在产假期间
- 25:17 把你fire
- 25:17 因为比如说你签的合同其实是at-will的
- 25:20 at-will的任何时候他都可以跟你
- 25:22 解除劳动合同
- 25:23 你为什么觉得你可以告他呢
- 25:26 我也是咨询那些律师
- 25:28 律师觉得目前有一些
- 25:30 就是可以告
- 25:31 我就把一些
- 25:32 我现在所有的材料都给律师了
- 25:35 就是
- 25:35 所以律师觉得
- 25:38 就是是可以那啥的
- 25:40 我现在还在跟律师
- 25:41 就是接洽着
- 25:43 大家如果知道更好
- 25:43 律师可以推荐给我
- 25:44 就是这个主要是律师决定
- 25:47 我其实也没什么概念
- 25:48 但我觉得
- 25:49 但觉得你的interest
- 25:53 你的incentive
- 25:55 跟律师的是有align吗
- 25:56 就是律师他是
- 25:57 他赢了才收你钱
- 25:58 还是他小时这样收钱呢
- 26:00 这个我可以告诉你
- 26:01 就是这样的
- 26:02 律师一般是这样的
- 26:04 我觉得以后
- 26:05 凡是想
- 26:05 大家想去告自己公司的人
- 26:07 都可以来找我
- 26:07 我可以给你们免费咨询
- 26:08 是这样的
- 26:09 你们都不需要给我钱
- 26:10 就是一般来说
- 26:12 这种官司是这样
- 26:13 就是律师他会判断
- 26:14 他要不要接
- 26:15 他一般来说
- 26:16 他如果判断他要接的话
- 26:17 他一般觉得是可以拿到钱的
- 26:20 可以打赢的
- 26:20 或者说可以拿到钱的
- 26:22 然后刚开始的时候
- 26:24 你肯定要付他一些钱
- 26:25 但这些钱呢
- 26:26 可能就是
- 26:27 可能就是几个meeting
- 26:28 或者几个call
- 26:29 然后之后就
- 26:30 不会再付钱了
- 26:31 然后之后就是说
- 26:33 你跟他签一个合同
- 26:33 就是打赢了
- 26:35 咱们五五分账
- 26:36 打输了
- 26:36 我就一分钱不要了
- 26:37 接下来
- 26:38 一般来说是这样的
- 26:40 就是这种
- 26:40 就是那种
- 26:41 就是叫什么
- 26:42 wrongful employment
- 26:43 就是wrongful termination
- 26:45 of employment
- 26:45 这种律师
- 26:46 他一般是这样
- 26:47 就是公司
- 26:48 就是因为他们
- 26:49 对于那种律师
- 26:50 他们就是
- 26:51 比如说跟一个大公司打
- 26:52 他们打赢了
- 26:52 他们也能复名嘛
- 26:54 所以有些律师
- 26:55 他们就俗称送棍
- 26:56 就是那个
- 26:57 就是
- 26:57 诉讼的神棍
- 26:59 就是那个
- 26:59 他们就说
- 27:00 特别喜欢接这种案子
- 27:01 然后就是
- 27:02 对
- 27:04 我
- 27:04 听说好像
- 27:06 目前我还不打算
- 27:07 我可能还不需要
- 27:08 去网上捐钱
- 27:09 我如果再需要去
- 27:10 网上就是需要来募捐的
- 27:11 我再找你的
- 27:11 咱们再聊几天
- 27:12 我们GoFundMe
- 27:13 一个里面page什么
- 27:14 对对对
- 27:15 可能在
- 27:15 在在在
- 27:16 上多少集的节目
- 27:18 可能大家
- 27:18 毕竟你在
- 27:19 你在大厂也工作了一些年了
- 27:21 我看你这点
- 27:21 这点就是
- 27:22 占你说几个meeting的钱
- 27:23 应该是给得起的
- 27:25 我有个问题
- 27:26 就是那你
- 27:28 你在做这个
- 27:29 就告他们的决定之前
- 27:30 可能你也做了很多的research
- 27:32 然后那比如说在过去的这些年
- 27:35 有类似的这种案例成功的吗
- 27:38 对我查过了
- 27:40 对那个就是这是我
- 27:42 就是就是UT Austin
- 27:45 我之前在UT Austin读的PhD
- 27:46 是我毕业那一年的
- 27:48 我还上过那个老师的课
- 27:49 那个老师是个女老师
- 27:51 他就是应该是在我毕业那一年
- 27:57 好像他们系
- 27:58 他们是ECE的
- 27:58 我是CS
- 27:59 他们ECE系的
- 28:00 没有给他tenure
- 28:00 然后呢
- 28:03 是因为就是反正我不知道
- 28:05 他们是给了没有给了
- 28:06 他们说了这个
- 28:07 EPSAC说了
- 28:08 就是说他怀孕这个事
- 28:10 还是没有说
- 28:11 我不知道
- 28:11 但是最后就是那个律师
- 28:13 就是他就把这个学校告了
- 28:14 然后告了之后呢
- 28:17 就是他们好像这还上庭了
- 28:19 并没有下面就是停
- 28:20 就是直接就是和解
- 28:21 就是并没有
- 28:22 比如说直接就settle
- 28:23 就是很多时候叫settle
- 28:24 他们并没有就是settle
- 28:26 然后
- 28:26 他们告了之后呢
- 28:29 然后就是
- 28:29 之后的结果
- 28:32 反正是最近两年
- 28:33 才出来
- 28:33 2023年2024年
- 28:34 就是那个老师赢了
- 28:35 然后就是
- 28:36 Austin给他付了
- 28:37 三million的补偿金
- 28:39 然后现在
- 28:40 发一倍的工资
- 28:42 他现在
- 28:43 他现在
- 28:43 反正他们真的不知道
- 28:47 他现在
- 28:47 还在学校挂名
- 28:49 他们就说
- 28:49 还在养他
- 28:50 他人已经不在学校了
- 28:52 就是结论就是这样
- 28:53 最后结局就是这样
- 28:54 现在
- 28:54 对
- 28:55 然后我还听说了一些
- 28:57 大部分case
- 28:58 最后都没有上庭
- 28:59 然后
- 29:00 一般来说
- 29:01 你只要不要去当什么
- 29:02 那种吹哨人
- 29:03 你应该也不会被那个啥掉
- 29:04 就应该还好
- 29:05 那你觉得你做这个
- 29:09 字节首个的这种吹哨人
- 29:10 是比较
- 29:10 那你说你也请了保镖
- 29:12 所以你对自己安全
- 29:12 我也没有做吹哨人
- 29:14 我也没有
- 29:14 我也没有说他们的
- 29:15 任何那个啥
- 29:16 我只是
- 29:17 那个
- 29:18 他们
- 29:19 对吧
- 29:19 他们啥
- 29:20 我不知道
- 29:20 我啥都不知道
- 29:21 我只是单纯的
- 29:22 就我自己的权益
- 29:23 我要告他们而已
- 29:24 他们把我这个
- 29:25 wrongful termination
- 29:26 在我看来
- 29:27 OK
- 29:28 我这个事情
- 29:30 我一开始
- 29:32 就是他们跟我说这个事
- 29:33 我一开始也觉得
- 29:34 这没啥事
- 29:35 然后我还咨询了一些
- 29:36 就是我很多
- 29:37 就是在学校里面
- 29:38 当professor的朋友
- 29:39 他们都觉得
- 29:40 这个事情ridiculous
- 29:41 这不光是
- 29:43 在学校里面的人
- 29:44 就你跟任何人说
- 29:45 大家都会觉得
- 29:45 ridiculous
- 29:46 就是任何
- 29:48 就研究背景的人都知道
- 29:49 这是很正常的一件事情
- 29:51 对就是拍了个照
- 29:52 然后后来他们就开始
- 29:53 找了一些莫须有的罪名
- 29:54 就把我开了
- 29:55 然后我我我甚至到现在
- 29:57 连莫须有里面罪名又是啥都不知道
- 29:58 就就是就是你
- 30:00 你可能不知道就是说到这
- 30:02 就是字节是有一个部门
- 30:03 叫锦衣卫的
- 30:04 这个时候就刷新你的下线
- 30:08 可以刷新本频道
- 30:09 跟着我下线了
- 30:10 锦衣卫是一个真的部门的名字
- 30:13 还是一个外号
- 30:14 他这个真的部门的名字
- 30:17 叫道德调查委员会
- 30:18 但本质上就是一个锦衣卫
- 30:20 他的那个reporting上级
- 30:23 直接到新加坡
- 30:24 然后每个地区呢
- 30:25 可能会有一些人
- 30:25 美国好像北美地方好像没有
- 30:27 对
- 30:28 然后理论上来说
- 30:30 理论上来说
- 30:31 他们我是一个美国的雇员
- 30:32 他们找一个中国人来调查我
- 30:34 这也违背了一些policy
- 30:35 我看了美国当地的法律
- 30:36 这在一个同样
- 30:37 可能也违背了一些policy
- 30:38 因为我现在也不知道谁调查我
- 30:40 但是我
- 30:41 I know something happened
- 30:44 就是
- 30:44 就是
- 30:45 嗯
- 30:46 就这个东西
- 30:49 别的公司也没有
- 30:50 对吧
- 30:50 反正就是个
- 30:51 就是个锦衣卫
- 30:51 然后他们有的时候
- 30:52 一旦
- 30:52 锦衣卫他一旦出手了
- 30:54 对吧
- 30:54 他一定要就是做点活来
- 30:56 不然的话
- 30:57 显得自己做无能嘛
- 30:57 白养他们
- 30:58 对吧
- 31:00 OK
- 31:04 OK
- 31:05 嗯
- 31:07 那听起来
- 31:11 你这毕业这几年
- 31:13 还挺多坎坷的
- 31:15 那你现在回看
- 31:16 我觉得这那一定是坎坷
- 31:18 这个是人生的一笔财富
- 31:19 你以后对吧
- 31:20 年龄大的时候
- 31:21 可以给别人讲这些故事
- 31:22 你曾经年轻的时候
- 31:24 告过字节
- 31:24 是
- 31:26 那你这还没有
- 31:27 还没有把那个
- 31:28 你告了吗
- 31:29 还是说在准备告
- 31:30 在联系律师
- 31:32 然后已经在准备
- 31:33 那个啥了
- 31:34 OK
- 31:34 因为之前是他们没有
- 31:37 就是把我的账号给
- 31:39 他们之前是一直给我发钱
- 31:41 所以你就懒得告
- 31:44 就是也不是懒得告
- 31:45 就是
- 31:45 就是他给你发钱
- 31:48 只是不让你用公司电脑
- 31:49 不让你用公司的资源
- 31:50 就是你不太好
- 31:53 就是没有现在这个十拿九稳
- 31:55 OK
- 31:57 对现在就属于就是
- 31:59 就是
- 32:00 嗯
- 32:01 对反正接下来就是
- 32:03 那个有任何这个后续
- 32:05 我都会在网上跟大家说的
- 32:07 然后也会来这
- 32:08 就是只要我还活着
- 32:09 对
- 32:13 然后别的其实还是没有小关系
- 32:18 看这些问题
- 32:18 我感觉都跟今天的这个话题
- 32:20 差得太远
- 32:20 所以我感觉不是特别的相关了
- 32:24 都以电
- 32:24 对
- 32:27 那比如说
- 32:29 那我们还问一下
- 32:30 你的字节的事情
- 32:30 既然反正你都已经
- 32:31 跟字节就已经说开了
- 32:33 那比如你的字节入职
- 32:34 这一年当中
- 32:35 你做的事情
- 32:36 你说你在产品的一个组里面
- 32:37 做偏科研的东西
- 32:39 对
- 32:39 是什么大概
- 32:40 也是训模型吗
- 32:41 还是什么的
- 32:42 对
- 32:42 就是我们那个组
- 32:44 就是字节也有个组叫Seed
- 32:47 然后他们会做各种各样的模型
- 32:50 就是反正是市面上
- 32:51 有的任何一个模型
- 32:51 他们都会复刻一个
- 32:52 他们也不care做的好还是不好
- 32:55 就复刻一个
- 32:55 然后我们组是商业化
- 32:57 然后就是本账TikTok的商业化
- 33:00 所以我们组会需要
- 33:02 比如说给一些那种产品
- 33:04 就视频产品
- 33:05 做一些那种就是广告
- 33:08 比如说你看一个视频
- 33:10 别人穿了模特穿了个衣服
- 33:12 对吧
- 33:12 然后你想买
- 33:13 对吧
- 33:14 那你想在你身上试一下
- 33:15 对吧
- 33:15 那你就用TikTok那个软件
- 33:17 可以把你
- 33:17 就是把那个衣服直接披到你身上
- 33:19 在这个比如视频里面
- 33:20 可以看到穿上衣
- 33:21 看上什么样
- 33:21 然后我类似
- 33:23 这个就是一个
- 33:23 Video Generation的东西
- 33:24 就是一个商业场景应用
- 33:26 我们组呢
- 33:26 就是我们组的可能的领导
- 33:28 就以这个为由头
- 33:29 然后所以要到很多卡
- 33:31 所以我们组呢
- 33:32 就在做一些视频生成的东西
- 33:34 这是我们组主要做的
- 33:35 就是跟业务链相关的
- 33:37 模型生成的部分
- 33:39 然后我主要就是做
- 33:40 因为Diffusion
- 33:41 或者说Flow Matching
- 33:43 这套算法
- 33:44 它在模型生成上
- 33:45 我不知道你最主要这个背景
- 33:46 就是现在Video Generation
- 33:48 主要用的算法
- 33:49 之前是Stable Diffusion
- 33:50 现在主要用的是
- 33:51 Flow Matching那个算法
- 33:52 然后这些算法
- 33:55 它有一些数学的
- 33:56 background
- 33:57 或者数学equation
- 33:57 然后我主要就是提供
- 33:59 或者说跟他们讨论一些
- 34:00 一些数学的insights
- 34:01 然后如果从
- 34:02 数学intuition上
- 34:04 就是修改这些equation
- 34:05 或者说生成一个
- 34:06 给一个新的算法去
- 34:07 去做这些就是生成的
- 34:09 我就是更多的是做一些
- 34:11 就是就是套一个
- 34:13 一些就是把我这个算法
- 34:16 在一些套一个办事成功之后
- 34:17 然后给他们拿到他们那个
- 34:19 千卡实验室跑去
- 34:21 大概是这样的就是这是我主要
- 34:23 当然我也会参与他们一些别的讨论
- 34:25 一些关于洗数据的然后
- 34:27 一些事但我主要做就是
- 34:29 就是研究员的方式任务就是干这个事
- 34:32 OK那那那你
- 34:33 投过毒吗或者你被投过毒吗
- 34:36 就是你自己directly的
- 34:38 我肯定是不会投毒的
- 34:44 我觉得我应该没有被投毒
- 34:47 因为就是
- 34:48 就是我们组之间
- 34:52 因为之前那个事情
- 34:53 可能之间
- 34:54 我不知道他们之间有没有
- 34:55 就是因为一个组里
- 34:56 肯定也会有些问题
- 34:57 对吧
- 34:57 因为我来我们组之后
- 34:59 我其实跟我们组人关系都很好
- 35:01 就是这个
- 35:03 为什么呢
- 35:05 你不是说你们字节人人自危
- 35:08 然后每个人都在提防
- 35:09 为什么他们都跟你关系
- 35:10 对因为我不需要那些卡
- 35:12 我就是一个做数学的人
- 35:13 然后我的scope
- 35:16 只是那些数学equation可能
- 35:17 所以我跟他们大多数人
- 35:20 是没有什么利害冲突的
- 35:21 基本上
- 35:22 然后我的那个事
- 35:24 主要是Seed HR搞的这些事
- 35:26 我听说就Seed的那个组
- 35:28 就是字节也有个叫Seed的组
- 35:31 他们号称他对标那个DeepMind的
- 35:33 对就是我们组内部肯定是有这样的问题的
- 35:39 就是
- 35:41 就是
- 35:43 就是有一部分人在做pre-training
- 35:49 然后
- 35:50 反正他们一般来说就是
- 35:54 post-training人如果
- 35:56 洗数据了
- 35:58 或者说他们就说你是overfitting
- 36:00 然后
- 36:01 他们就互相找理由说你那个work
- 36:04 你把那个点提高了
- 36:05 或者是假的
- 36:06 反正就通过这样的攻击方式来
- 36:08 来证明别人实际上啥也没干
- 36:10 他们本账就是比谁是那个倒霉的二
- 36:14 大家就是这样
- 36:16 我参与过一些meeting
- 36:17 也听说过一些事
- 36:18 基本上这样大家操作的
- 36:20 就是即使你
- 36:22 你洗了数据
- 36:24 把数据洗得很好
- 36:24 然后模型点提高了
- 36:26 但是pre-train的人就说
- 36:27 你这属于overfitting
- 36:29 就不算这件事情
- 36:34 那既然你说的这个文化这么的有毒
- 36:39 就真的是双关语
- 36:41 这么有毒的话
- 36:42 那为什么还是有很多人在往
- 36:46 无论是北美字节还是国内字节都在就是往里面加入对这个我也很神奇我之前也问过很多这个问题就是北美字节我觉得因为是给的钱比较多这是第一然后第二是北美的字节一直在扩张
- 36:59 我觉得很多人确实找不到工作
- 37:01 然后就只能先去字节苟一段时间
- 37:03 就是有一部分比较厉害的人
- 37:06 可能是为了那个钱
- 37:07 但是还有很多应届毕业生
- 37:09 我问了很多进字节的人
- 37:10 他们就是你就回来
- 37:11 他们跟我说
- 37:12 他们确实没有找别的工作
- 37:13 所以只好去字节
- 37:14 国内的话
- 37:15 那边字节最好的
- 37:17 字节所以可以想干嘛干嘛
- 37:18 这也是为什么字节的HR
- 37:20 根本就无法无天的原因
- 37:21 因为没有人
- 37:23 他们准备了
- 37:25 他们在国内打官司
- 37:26 可能是不可能输的吧
- 37:28 所以他们就已经消装保护罩了
- 37:32 在他们那可能已经没有王法了
- 37:35 那比如对于听你描述的
- 37:42 如果说接下来
- 37:43 如果要入职字节
- 37:45 做大模型这方面的话
- 37:47 然后而且是那种需要很多卡的这种话
- 37:50 可能他们无论是自己愿意或者不愿意
- 37:53 都会被卷入你说的这种投毒
- 37:55 或者被投毒的这种文化当中
- 37:57 是吗
- 37:57 就听起来好像无可避免了
- 37:59 除非像你一样
- 38:00 做一个这种什么数学方面的东西
- 38:01 就是是无针不要卡
- 38:03 然后也不想要升迁
- 38:05 只想听瓜的这种人的话
- 38:06 否则他们可能就要
- 38:08 就要被卷入这种东西
- 38:11 对基本上
- 38:12 因为我觉得之前
- 38:14 科宇那个事没爆出来之前
- 38:16 大家不知道能干这个事
- 38:18 我也不知道能干这个事
- 38:19 就是你从来没有想过
- 38:21 有人会在你的代码里面给你下毒
- 38:23 或者说在checkpoint那下毒
- 38:25 或者在disk上直接给你下毒
- 38:27 把那个数据直接改了
- 38:29 就是没有人想过这种事情
- 38:31 是有人可能会干的
- 38:33 或者说
- 38:34 或者我以前写数学论文的时候
- 38:36 我还真知道有人干这个事
- 38:39 但他不是下毒
- 38:40 他是这样的
- 38:41 就是他为了这个领域
- 38:43 只有他能做
- 38:44 或者别人呢
- 38:45 就是做follow up
- 38:47 一定会带上他
- 38:48 他就把自己的证明
- 38:49 都故意改错
- 38:50 什么东西
- 38:50 这个在数学领域
- 38:54 是非常常见的
- 38:56 这数学领域的投毒相
- 38:58 对对对
- 38:59 这个是非常常见的
- 39:00 圈内人都知道
- 39:01 有些人就这么干
- 39:02 有些intentionally
- 39:03 读这个
- 39:03 因为我之前
- 39:05 跟有些人写过paper
- 39:06 他就是故意把那些证明
- 39:07 证据的全部全写错
- 39:08 但最终结论是对的
- 39:12 对最终结论是对的
- 39:13 他把他的过程都给写错
- 39:14 然后所以一般人你是复现不出来的
- 39:16 对吧
- 39:17 然后那你复现不出来
- 39:18 你就得发个邮件问他
- 39:19 你发个邮件问他
- 39:20 他跟他预约
- 39:21 你约了几次
- 39:21 你就得带着他一起写这paper
- 39:23 所以他就可以永远在这些文章的follow up上
- 39:25 OK
- 39:27 有些人就这么干的
- 39:28 反正就跟你邮件解答
- 39:29 他会把他的正确版本给你弄出来
- 39:31 如果我不小心我有个typo
- 39:32 或者什么的
- 39:32 对对对
- 39:34 然后他就
- 39:34 这个时候你可能也不好意思
- 39:36 不引用他
- 39:37 或者说就是大家就客气一下
- 39:38 然后后来就一起写了
- 39:40 然后之后就他就不断的在做这种事
- 39:41 然后就
- 39:42 所以就永远有paper可以写
- 39:44 永远永远
- 39:44 因为别人需要写这follow up
- 39:46 就需要来找他
- 39:46 你不找他
- 39:47 你没法理解这玩意
- 39:48 当你找错了
- 39:49 他故意的
- 39:49 我知道数学
- 39:51 或者说偏理论领域
- 39:51 是有人故意这么干的
- 39:53 但是之前代码这个东西
- 39:55 我觉得之前大家想的都是
- 39:57 或者说以前的模型训练
- 40:00 没有这么多staff
- 40:02 我觉得可能
- 40:03 对吧
- 40:03 比如说以前就logistic regression
- 40:04 或者kernel regression
- 40:05 这种东西就一个人搞完了
- 40:06 或者一个training
- 40:07 没有什么post-training
- 40:09 training RL
- 40:09 你包括最近
- 40:11 比如五年前的
- 40:11 那种这种deep learning的什么的
- 40:13 都是模型文件
- 40:14 就几百行就搞完了
- 40:15 你都没有那么长的pipeline
- 40:17 就不像现在那种
- 40:19 一
- 40:19 就像你说的pre training post training
- 40:21 中间还有很多步呢
- 40:22 对吧
- 40:22 对
- 40:24 对
- 40:24 我觉得他就是因为很有很多步了
- 40:25 所以
- 40:26 就是你就可以在这东西上做文章了
- 40:29 你之前的话你就一人在那儿
- 40:32 谁给你下毒啊
- 40:33 你自己拿着
- 40:34 对吧
- 40:35 现在的话就是有很多步了
- 40:36 大家要交换checkpoint
- 40:38 要做各样各样的事情
- 40:39 然后就感觉就可以做事情
- 40:42 而且有的时候比如说
- 40:43 他们就说网盘确实没空间了
- 40:45 就把你checkpoint给你删了呀
- 40:46 那你也没啥
- 40:48 你也没办法
- 40:49 他就是不小心的呀
- 40:51 他就是故意的
- 40:52 他就是不认你没有证据
- 40:55 他就不小心的
- 40:55 我就不小心把你删了
- 40:56 这个我是遇见过的
- 41:00 这个我遇到过
- 41:01 有人把我训好
- 41:03 checkpoint也给我删了
- 41:04 那没意义
- 41:06 你不再上传
- 41:07 或者再训一遍不就行了吗
- 41:08 就是这等于是占卡时间的一个要两周三周呢
- 41:12 如果你是微调的话
- 41:13 你是简单的那种东西还好
- 41:15 但是如果你是视频的话很久的要
- 41:17 人为的去阻挠你的进度
- 41:20 然后你就出不了成果
- 41:21 对对对
- 41:22 然后你就可以打
- 41:23 因为你绩效是大家互相互相评的嘛
- 41:25 然后你就给你可以打低绩效
- 41:27 然后他就可以往上爬了
- 41:29 对
- 41:31 那刚才我们讨论到说
- 41:32 你觉得这个问题无解
- 41:33 那那我听起来这个结论就是说
- 41:35 那如果不不逼的这个拉curve
- 41:37 一定要有人拿低绩效
- 41:38 那这个问题会不会有短期的缓解
- 41:42 还是说他们马上又想到新的方法去整人呢
- 41:44 我感觉他们还是会有新的方法的
- 41:50 这个毕竟就只要有规则
- 41:53 这规则它不会永远公平
- 41:55 只要有人愿意去钻这个规则漏洞
- 41:58 去坑人
- 41:59 去整人
- 42:00 就是我觉得
- 42:01 这你没办法吧
- 42:04 我觉得
- 42:04 OK
- 42:05 我感觉
- 42:06 就是说还是
- 42:07 就是有些人
- 42:10 他可能太闲了
- 42:12 我也不知道
- 42:13 那在这个这期节目结束之前的话
- 42:16 那你想对这个
- 42:18 其他的在大厂还在struggle的
- 42:21 无论是在字节struggle的
- 42:23 还是在别的大厂
- 42:24 train模型啊
- 42:25 或者说
- 42:25 我敢说是在train模型
- 42:27 现在至少还还还还
- 42:29 感觉是在这个风口浪尖上面
- 42:30 很多不train模型的
- 42:32 反而可能还被
- 42:33 被多少有点边缘化的感觉
- 42:35 你对这些做研究的同学
- 42:37 有什么寄语吗
- 42:38 我也没啥寄语的
- 42:40 我感觉我说点我的感知
- 42:42 就是关于这个事情
- 42:45 我感觉以前几年前
- 42:50 那个时代
- 42:51 计算机这个领域
- 42:52 好像确实是一个人
- 42:53 可以做科研的
- 42:54 一两个人也能做到
- 42:56 很好的科研
- 42:56 或者很有impact的科研
- 42:57 然后现在感觉这个时代
- 43:00 就是你没有一个team
- 43:02 然后没有一个
- 43:03 就是很大的组
- 43:04 就是基本上很难做出来
- 43:07 就是你还是能写一些
- 43:09 就是纯数学的文章呢
- 43:11 或者说你有纯理论的东西
- 43:12 但是真正工业界
- 43:13 或者application上有impact的东西
- 43:15 就是只能是大的组搞出来的
- 43:17 所以现在很多学生都已经
- 43:19 就是不想读PhD了
- 43:22 或者不想拿这个学位了
- 43:23 就只想去的就挣钱
- 43:25 对我
- 43:26 说做研究就是
- 43:27 主要focus在大模型方面的研究
- 43:29 对吧
- 43:29 对对对
- 43:30 我的感觉是
- 43:31 那你要说我寄语的话
- 43:33 我就是觉得大家还是忍住别去的吧
- 43:36 是吧
- 43:37 我觉得这是实话
- 43:40 我真的觉得拿到PhD学位
- 43:41 对以后还是有很多帮助的
- 43:43 可能短期内它确实会影响你少挣个几千万
- 43:46 这确实有可能的
- 43:48 我觉得
- 43:48 我觉得
- 43:50 但是PhD这个degree可能
- 43:53 就是你如果不拿的话
- 43:56 你以后再想拿可能就不要拿了
- 43:57 你quit了之后对吧
- 43:58 但是我觉得你拿了之后
- 44:01 还是比较好
- 44:02 我觉得对我还是拿到这个学位
- 44:04 我作为一个
- 44:05 就是过来人
- 44:06 我感觉
- 44:06 这是我觉得
- 44:07 因为我知道很多学生
- 44:09 现在都打算quit PhD
- 44:10 直接上班去
- 44:11 那你觉得是degree
- 44:13 还是说在PhD
- 44:14 这个journey当中的一些经验比较重要
- 44:17 因为你刚才有
- 44:17 我记得你刚才说
- 44:19 有一个什么
- 44:19 有一个加一什么是
- 44:21 你认为他是硕士学历
- 44:22 所以他不太懂一些研究方面的这种
- 44:24 这种东西
- 44:25 这是一个好问题
- 44:26 那你觉得是什么
- 44:27 因为我还听你能描述
- 44:29 你可以focus在degree上面
- 44:30 但我会感觉说
- 44:31 那degree就是一张纸
- 44:32 因为我认识过有的那种第四第五年
- 44:34 比如说跟老板闹掰的人
- 44:35 然后他们也走
- 44:36 我会在心里
- 44:37 反正也认为他们也是PhD
- 44:39 只是因为某些原因
- 44:40 现在已经没法完成一个PhD的journey了
- 44:43 因为除非你做理论
- 44:45 你可以心无杂念的做你的理论
- 44:48 你只要但凡做什么journey
- 44:50 或者做AI做应用
- 44:51 一定得去公司实习
- 44:52 你到暑假就跑去实习
- 44:53 对
- 44:54 你已经不存在能在学校里
- 44:56 完成PhD的journey的一件事了
- 44:58 除非你做纯理论
- 44:59 而且导师对你的指导也非常有限
- 45:01 因为都是在炼丹
- 45:02 都在公司炼丹
- 45:03 对
- 45:03 这就是
- 45:04 不是炼丹就是用
- 45:05 我刚去字节
- 45:06 我以为
- 45:07 我就问他们
- 45:08 我就问那些底下写码的那些牛马
- 45:09 就是问他们
- 45:10 滚里边
- 45:11 我就说你们这有什么
- 45:12 散散说
- 45:12 面多了加水
- 45:14 水多了加面
- 45:15 这这没有任何
- 45:22 就是所以
- 45:24 我觉得如果你是做理论的话
- 45:26 或者你对数学非常感兴趣
- 45:28 你在学校里边
- 45:29 我觉得还是能完成一些真那的
- 45:31 也能拿到学位的
- 45:32 但如果你是
- 45:33 就是想完成真儿那件事情
- 45:37 是不可能的
- 45:37 但我觉得已经
- 45:39 我也不知道
- 45:42 我也不好说
- 45:43 但我觉得就反正如果是我的话
- 45:44 我应该还是会拿到这个学位的
- 45:46 我感觉
- 45:47 就是
- 45:47 即使在现在的情况下
- 45:50 我感觉我还是会尽量去拿到这个学位
- 45:52 然后再来出来做点啥的
- 45:55 这个听起来
- 45:56 你是认为在学校读PhD的时间
- 45:58 其实你已经没有办法像以前那样
- 46:00 pre-LLM的era
- 46:01 能够真的静下心来
- 46:03 做很多东西
- 46:04 而是被迫去大厂实习
- 46:06 被卷入这种大的组
- 46:07 然后只是通过耗时间
- 46:09 通过各种方法
- 46:11 最后拿到这个degree
- 46:12 你认为这个degree
- 46:13 还是非常重要的
- 46:14 对我觉得这个degree
- 46:15 是非常重要的
- 46:16 而且还有一件事情就是
- 46:17 你在学校里
- 46:18 现在写paper
- 46:18 已经没有像以前
- 46:19 那么容易中了
- 46:20 我也觉得以前
- 46:22 就算中了
- 46:23 也没有什么意义了
- 46:24 对你说的没错
- 46:26 现在paper太多了
- 46:28 现在paper太多了
- 46:28 没错
- 46:29 它已经贬值了
- 46:31 以前你在学校里面
- 46:33 你自己写三个月文章
- 46:35 很牛逼的
- 46:36 现在一个会议的中稿率非常random
- 46:39 而且审稿人也非常random
- 46:41 你根本都
- 46:42 你不写足够多文章
- 46:43 你就是中不了
- 46:44 没办法
- 46:46 所以在学校里面
- 46:47 我觉得还能沉下心来做科研的人
- 46:50 真的可能就是家里不缺钱
- 46:51 然后自己又非常想enjoy做PhD
- 46:56 读PhD这件事情的人
- 46:58 或者想找为少一些爬路的人
- 47:00 我感觉
- 47:01 我像学生听你这么说
- 47:03 我非常感激
- 47:05 当时我读本科的时候
- 47:07 当时我那个本科导师带我做research
- 47:09 然后就手把手教我怎么
- 47:11 领上做科研这条路
- 47:13 因为现在我看到很多那种
- 47:15 就是我自己感觉
- 47:16 就还不太成熟的PhD
- 47:18 就每个deadline都要带好多本科生做研究
- 47:21 我就感觉
- 47:21 我并不是觉得他们带不了本科生
- 47:24 而是说他们带的这种性质是不太一样的
- 47:27 更多的是那种盲目的冲啊冲啊
- 47:30 反正就是像你说的嘛
- 47:31 因为中的几率低又很random
- 47:32 那随便做个东西投出去吧
- 47:34 投出去了
- 47:35 我能作为PhD学生的角度
- 47:37 他能写一个说
- 47:38 你看我PhD毕业前就mentor过很多学生
- 47:40 所以本科生的角度来说
- 47:41 有一个人愿意给我说说话
- 47:43 我就很开心了
- 47:44 然后从教授的角度来说
- 47:46 那我啥都不干
- 47:47 又就挣了一些paper
- 47:49 我感觉这个是好像看起来是win win win
- 47:52 但是实际上我总感觉是lose lose lose的一个东西
- 47:56 是的吧
- 47:56 我感觉这期反正我也不知道有什么
- 48:00 可以更深刻的总结
- 48:03 我只能祝愿你跟字节的法律诉讼
- 48:07 能够顺利进行
- 48:11 然后你的人身安全也可以保持
- 48:13 然后你的保险也能够得到方法解决
- 48:15 这也确实是一个很垂起的问题
- 48:20 这些都是财富
- 48:23 以后可以写书的
- 48:24 我觉得是都是财富
- 48:26 但现在不还得过吗
- 48:29 对吧
- 48:29 现在还是得费用保险怎么弄
- 48:31 不然是麻烦事情
- 48:34 挺好
- 48:35 那可以之后
- 48:36 我们可以半个月一个月再回访
- 48:39 看看你有什么新的update
- 48:41 对
- 48:42 然后那个时候咱们可以聊一聊别的话题了
- 48:44 因为今天的感觉非常沉重
- 48:45 一开始就来了一个当头重击
- 48:48 然后导致我的整个脑子都不是特别的明朗
- 48:51 就是
- 48:51 那下次可以把你列的这个topic再整理一下
- 48:54 然后可以聊一聊
- 48:55 好
- 48:55 最后再次感谢李丁
- 48:58 邀请我来参加李丁聊天室
- 49:00 也希望大家多多关注
- 49:01 李丁聊天室的频道
- 49:02 陆续还会出出更多精彩的节目
- 49:04 对谢谢
- 49:06 也祝你一切顺利
- 49:07 拜拜