ICCAS Day 2 & IOP Day 5: 20 Feb., 2023
今天是正是开学第一天。前几天我问了问物理系的班长,她把我拉进了班车群,自此我就不用担心早上出门坐地铁还要花钱了。这天有一项工作,就是我要去见化学所的彭老师,把我的开题报告交上去,并给她瞅两眼我的导师指导手册。我原本的计划,就是坐物理所的班车,先在计划中的IOP-A楼附近下车,再找个单车骑到ICCAS,交东西。当然我这么一整,突然想起来距离上次见何老师差不多是一周,所以我就知会了一下何老师,简单做了个汇报ppt,给何老师讲完之后,再找到硬盘把Ta11的数据上载到服务器,我就可以训练Ta11的数据了。
结果等我到达礼堂东边等车的时候,首先我不知道物理系这个班车车牌号是多少。问了班长,班长才在群里做了回答,又说这个车路上遇到了交通事故,晚些时候才到。等待车子来的时候遇到了一些同乘物理所班车的兄弟,简单聊了聊天,却突然看到一个我很清楚是要在学校和化学所之间通勤的队友登上了一辆早早停好的车子。
我有些疑惑,便登上车询问情况,得到的结论是早在上个学期我还在新加坡的时候这个班车就有了,而且是停化学所。考虑到这件事情,我短暂下了车,跟几位坐物理系车子的兄弟说了再见,转头上了化学所的车。
化学所这个车掉头的位置有些离谱,感觉这个地方阴气有点重:
以往在玉泉西街掉头,干净又利索。这把有点又臭又长,跨过玉泉路口,扎进了玉泉路口以东通往五棵松的滚滚车流。一路磨蹭,五棵松桥以北进四环主路是个堵点,定慧桥是个堵点,连tm四海桥都堵得稀里糊涂,最后停在了中关村二桥的辅路上,我们要步行前往化学所。
由于ICCAS的逆天行政,我没有卡,而进入所需要刷脸,我就和队友们结伴而行,往里扎,这样可以卡进去。不出所料,我成功了。刚好有个老兄跟我一样在2号楼,于是借助他的卡,我直接从2号楼正门钻了进去,先去见何老师。
这把何老师和AP. Li都没约到会议室,我就直接在何老师办公室里汇报我的毕业论文进展。不得不说目前的进展还是令何老师非常满意,尤其是当我告诉他Ta9到Ta10的迁移学习中,Ta10的训练样本可以压缩到至多1000个采样点的时候,可以看出他对我的进展有较大兴趣。
我的毕业论文三件事:
IridiumLINCH-SK
- Ta9到Ta10-14的迁移学习:BS. Yang之前有一篇文章将要投稿,实现了Pt8到更大Pt团簇的迁移学习;迁移学习的程序都是BS. Yang写的,我照猫画虎不成问题;
- Ta9到Pt9等其它金属团簇的迁移学习:之前从Pt8到Rh4Co4-的迁移学习好像是实现了的,因此不同金属团簇间的迁移学习应该问题不大;
- Ta9到Ta4O5+等金属氧化物团簇的迁移学习:有一定挑战性,暂时未知,对于本科生的论文,就算没做出来也问题不大(
刚刚初步实现了第一件事,但相比它,第二件事和第三件事的进展就不怎么亮眼了。Pt9的团簇,在提交任务的最后关头我选择使用def2TZVP这种大基组,就导致它算得很慢,在何老师这里我只能说我完成了NN的训练,但优化到底的结果还没出来。Ta4O5+则更是离谱,我做的ppt跟何老师说我的前10步DFT还没算完,但我在做完ppt之后又做了一些事情,收集齐了所有10步DFT的文件跑NN,结果这天醒来发现参考网络误差太大直接跳出了……
中间BS. Yang被召唤过来研究这个问题。最后得出解决方案:
- 先扩大数据集,并使用传统DNN解算出诸极小点;如果传统DNN都没戏,那就只好上遗传算法了;
- 实在不行,把Ta4O5+替换成Ta8O+,在时间允许范围内一步步来(指Ta8O+到Ta7O2+,一次把一个Ta换成一个O,依此类推)。
确立了下一步工作决心,汇报就算结束了。我掏出了早就准备好的导师指导手册请何老师签字。导师指导手册包含三部分:论文计划书、导师指导记录和阶段总结。其中计划书和阶段总结需要老师签字,而导师指导记录学生签字就可以了。我的阶段总结写了一篇,就是把上回跟何老师汇报的ppt文字抠下来复制了一下。何老师犹豫了一下,签字了。
签完字,我被AP. Li叫去。此前提到,我被师姐喷了,原因是挤占了服务器资源。我跟AP. Li和BS. Yang都抱怨了一番,AP. Li表示我教你用超算啊。然后我就被叫去学习超算的使用方法了。
其实,如果要论超算,我比化学所那个服务器接触得都早:早在何老师把我、AP. Li、BS. Yang拉在一起组建了负责指导我毕业论文的微信群的时候,AP. Li就帮我申请好了北京超级云计算中心的账号。我尝试在超算上折腾了几番,干出了包括不限于在还没有安装Gaussian的时候跑Gaussian任务,尝试着在所有先辈都用命令行的情形下使用GUI操作超算等骚操作。倒也不至于说哪位老师看不下去了,应该是因为我这个账号没有GPU核心,算不了NN,我就被BS. Yang叫去化学所服务器,学习了在化学所服务器上CPU、GPU之间反复横跳进行机器学习的过程。被AP. Li拉去学习超算的过程,熟悉,是因为见过;陌生,是因为当初在超算上整的全是烂活儿。
AP. Li用遗传算法给我演示超算的使用方法。由于AP. Li明确表示她全权负责用遗传算法帮我跑Ta4O5+,我便有时走一走神,突然注意到这间亮堂堂的离何老师办公室贼近的办公室居然也是几位师姐的工位所在地。比起BS. Xu(也就是我暂驻的休学师姐的工位)、BS. Yang工位所在办公室,这间办公室的环境明显要好上很多。隐隐感觉BS. He(把我批判了一番的师姐)就在这间屋,但我没敢认。
超算的使用我学得一知半解,但我至少知道了在超算上可以开2倍速(化学所服务器默认的规矩是16核,只能往下压不能往高打,超算32核随随便便)。于是我回到课题组,首先上载Ta11的数据,其次准备开始Ta4O5+的传统DNN。迁移DNN做多了,我都忘了传统DNN该怎么操作了,我自作主张删掉了脚本中母神经网络相关信息,结果报错了,拉BS. Yang排故障,他:你的母神经网络呢?
排除了故障准备继续,结果脚一蹬,屏幕熄灭了,一看:我把主机电源线给踢了。
为什么我会踢掉电源线了?因为BS. Xu的台式计算机正面版上的USB接口全玩几把犊子了,我就只好转一下主机箱找背面的USB接口,结果,嘿嘿,线踢掉了吧?
重新连接到服务器,之前发送的几个计算请求都断掉了,就只好手动继续。我尝试进行了几次Ta4O5+的传统DNN,结果总是因为误差太大跳出,看来有必要扩大数据集了。扩大数据集的任务就交给超算做吧。
又问了BS. Yang如何直接打开XShell就能连接到对应分服务器的会话,学到了。
既然Ta11的数据被我从硬盘上载完毕了,那我就理一下文件树,让神经网络开始运算吧。
Ta11还好,只跳出了一次,第二次重新尝试,就正常进行下去了。
去上了个厕所,上厕所的时候,BS. Yang邀请我跟他们一起去吃午饭。考虑到化学所午饭比物理所更好吃,我便和他同去了。吃完饭,收拾了一下我就溜了。
我在即将去物理所之前,给物理所带我实验的师姐发了个微信。因为这天是20号,样品是9号烧上的,今天应该烧制完毕了,我就问师姐我样品怎么样,结果:
无论如何我决定亲自去看看。到达课题组,我先找到炉子,看了一眼样品,发现其实烧出来了一些,但是太tm少了,决定提高温度继续烧,从730℃到680℃提高到850到750℃。师姐让我设定温度,但我发现我还是有点儿大聪明。
接下来我赛博进组,结果又像当初一样在超算上整出一堆烂活儿,最后AP. Li找了两位超算中心的工程师拉了个群帮助了一下我,总算把事情解决了。超算和本地服务器提交任务的方式不太一致,但差不多都是那么回事,看来我的计算机水平还是要更好一些才能应付很多问题啊。
师姐弄来了一些TaNi2Te3先前制备好的样品,做SEM表征。全程由她操作,我负责听怎么回事。因此我没法把这种实验过程写得像《湖区杂记·近代物理实验》那么详细。
表征的间隙我出去了一遭,一方面是因为理论上上周四应该送到A楼前台的临时卡周四一整天都没到,而我上周五根本没去IOP,因此要领取卡。另一方面是因为我在化学所开始运算的Ta11神经网络要输密码了。
做完表征,我突然想起来我被约了饭,于是仓皇润掉了。