日常记录

叠加态

2022年8月10日

还有几日就要返校，本计划下学期不再选课，转而自学，但学分清查，惊讶发现选修分数少了1分，因此还是选了群论2
我对数学结构/理论理解一般，但对其威力和结果十分欣赏，因此对一个理论/课程的学习，我往往是从其能否解决重要问题来考量的。如若不是假期见了些优秀的群论作品，我或许本科不会再学群论2（抽象的数学课于我并不是愉快的东西）因此也是暗暗庆幸，还能有机会体验和理解那些曾经囫囵吞下的定理，窥探一下诸如“半单李代数”这类理论框架。想来这也是我学习物理的初衷之一，毕竟一个造出了原子弹的学问，还是很令人向往的。（发现自己学了几年物理也不会手搓反应堆，确实是件憾事）
今日未做什么事情，夜里喝了些自酿的葡萄酒，开了个组会。说来惭愧，最近有些摆烂，沉溺于厨房，本该准备的报告得推迟到下周了
明天要做些事情了

叠加态

8月11日（今日已健康上报）

早上读到一篇文章：AI的强大，超乎我们的想象
恰好是我之前看过的Podcast的中文翻译，采访了Deepmind的一位科学家。（虽然这个标题一股广告词味道），最后有段话很有意思
今天的目标是读完Steerable Group Convolution，把Clebsh-Gordan tensor product 的应用看明白。另外开始看Generative Models，然后还有时间的话根据torch的教程完善CNN的代码
发现自己专注力不是很高，容易划水，遂测了一下睡眠质量。

叠加态

8月12日（今日已健康上报）

关于Steerable Group Convolution的部分note写的实在太含糊了，上午看了一会儿克莱因戈登张量积、球谐函数之类的，都是量子力学里面的老熟人了。但还是没明白在干嘛。好在还有教学视频，大概理解了基本的原理：相比于初始化一些随机的kernel，我们可以准备一些特殊函数，然后初始化他们的随机线性组合，这样我们只需要计算这些特殊函数和图像卷积，然后利用这些特殊函数的性质就就可以给出任意群变换下的卷积结果，从而免去了离散化时寻找子群的麻烦（毕竟SO（3）的N阶子群并不总是好找/能找）
看了看code assignment，是用三维等变网络来预测分子的性质，分子数据大概长这样（三维的、可以旋转）

上次讲的时候，大家都觉得等变网络≈data argumentation，但这个例子做完让我觉得差别还是蛮大，毕竟三维的数据，你要arguementation对内存可真不友好，效果也很有限。越是高维的对称性，等变的架构越有意义吧
摆烂了，看了一天有点伤眼睛，下午休息一会儿

叠加态

8月13日（已健康上报）

今天计划阅读Generative Models
昨天浏览了一篇Physics Based Machine Learning 的工作，是国防科大的Dong Bing课题组做的PDE-Net，能从数据中学习系统的偏微分方程，从而可以用于广泛的动力学系统、自动控制领域。其基于的核心定理是卷积算符可以近似差分算符，因此可以用一类卷积网络$D_{ij}$代替 $a_{ij}(x,y)\partial x^i \partial y^j$ ，含时的线性微分方程可以写 $\partial_t u = \sum_{i,j}D_{ij}u$ ，然后用这个去学习高精度数值解的结果。然后作者以某种方式保证了误差随着时间保持在一个可控的水平（不会随着时间指数积累），比之前的Frozen-Net效果好很多。神经网络在这里的好处有几个：1.对有大量数据但缺乏原理的系统，相当于我们拟合了一个微分方程；2. 在同样的精度下，网络的计算效率高于传统的数值方法（并不绝对）
个人感觉，对于低维、原理比较完备的动力系统，这样的替换没啥意义（而且还有灌水嫌疑），但是作者显然更关注该模型的泛化能力。我觉得网络真正的应用价值，应该在高维且解析困难的场景（比如学习一下股价在一段时间的动力学规律etc）
github 预览markdown的公式似乎效果不佳

下载了一个mathjax的公式插件，但似乎没啥用，恼
刚才又读了一下自己的note，满篇都是 we can, we may, we could，是否搞错了什么，还是不习惯英文写作吗
实际上，又改了一下午代码😥写了很多test，捉出来不少bug，TDD（Test Driven Development）确实好。
健康上报系统似乎抽风了，我填报几次没有记录😇难道是因为我曾经删除过这个功能，现在不能用了？

IridiumLINCH-SK

叠加态（已健康上报）绷不住了

叠加态

IridiumLINCH-SK 提高政治站位之举罢了（）

叠加态

8月14日（已健康上报）

今天要读的还是Generative Model，不过也可能会沉溺于修改代码😇
反转了，出去吃喝玩乐，如是一天

叠加态

8月15日（已健康上报，未做核酸）

快要回北京了，希望能度过充实的时光，这几天就先不学了，看看书轻松轻松，然后把一些琐事解决了
今天实在是没做什么，跟一群作为家庭经济支柱的中年男性亲戚吃饭，听他们讨论政治、讨论战争、讨论经济、讨论生意和情谊，感到十分鲜活，他们是这个社会最直接的参与者和贡献者，比尚未入世的我有丰富的得多的人生体验。但说起经济形势，说起疫情，说起近日的高温，我们俨然活在一个关联紧密的系统里了。
导师发了一些资料，惭愧，之前看别的去了，不少资料都没看完。明天还是要加把劲。

叠加态

8月16日（已健康上报）

写note
课题组群里在讨论一个陷入local minima的优化问题，看起来是某位师兄写的notebook。现在我非常喜欢这些notebook，不仅可以云端运行，还支持markdown，各种功能都能清晰展示，还可以是很好的教程。近来深感自己的“输出”能力欠缺，还得多练习才是。
在另外帖子上的讨论给我很多启发，有的事情也是写着写着慢慢明确的，这很有意思

叠加态

cai_b 发错位置了吧

叠加态

8月17日🤓🎂🐸🕝（已健康上报，未做核酸）

之前一直在看Equivariant CNNs，某种程度上也算入门CNN的理论部分了（相比之下Deep Learning那本花书实在是太包罗万象）
但其实差的很远，许多涉及随机过程/概率分布/信息熵/误差上下界的理论我都没看，这部分在Generative Model可能会比较多，而以我的概率论基础不一定吃得下（何况还有不少radon测度，sigma代数，borel集之类的东西，晕）
前不久申请了StableDiffusion的内测资格，结果今天老师就让我们去看Diffusion Model，我当然是迅速的接下啦🥂
初步计划是前十天看完教程，基本搞清楚理论，中间十天实战，复现一些project，最后十天“输出”，写一个tutorial，加点notebook和思考题，有必要的话整个pdf，应该就够了

叠加态

8月18日（已健康上报，已做核酸）

今天要记得做核酸，希望20号能如愿进京
Generative Model开造
昨天给我爸换手机出了点岔子，因为开组会从晚上九点半讨论到晚上十一点半。和一位博后聊的时候也发现了混淆业界和学界目标的情况：这位博后觉得看不上GPT-3这种百亿千亿参数的大模型，觉得就是嗯造算力，训练一次要四五百万刀乐，更何况就是暴力堆叠，没什么技术含量。我的评价是：典型的学界看不上业界，业界的目标本来就是10到100，堆算力就是他们的逻辑；而学界更应该进行创新，走出新路，如果能够做到同等表现，模型参数锐减，那就离被收购不远了；相反，如果学界的人还在做那些没啥创新的“拿来吧你”研究，你的研究生博士生做一个月半年的，企业一来几天就全做了；学界应该做那些业界未必能做的东西，我想这才是研究的意义所在。
简单来说，一个东西值不值得研究的判据：一群训练有素的技术人员在不了解背景的情况下可以迅速完成的，就不值得研究。
换句话说，现在很多领域大量的机器学习+X的文章，如果任何一个对pytorch, tensorflow乃至低代码工具熟悉的人，拿着数据就可以得到结果，那么这些就是很无聊的。与其水这些文章，不如老老实实去收集更多更好的数据，做好标注，然后开源，这影响力将会大得多。
忘了机器学习和各种技术，深入了解要解决的问题，深入domain knowledge，然后试着发现其中的痛点和解决方案，并用这些知识反哺机器学习的改进，我想这才算是做出有价值的ML+X工作吧。（不过，如果你是个啥也不会的低年级本科生，抱着学习技术的心态去参加的话，对DomainKnowledge倒不必要求太高，你做的是1到10，不是0到1）
对于自己捣鼓出一点数据，然后就开始拿神经网络“拟合”的，感觉没法走太远（是的，很多文章都在做这种事情，P用没有），要么踏踏实实准备数据，要么深入地思考问题。
当然啦，如果想做的不是从0到1，而是从1到10，做几个项目掌握完整的技术栈可能更有意义（正是我这种低年级练习生该做的事情），要想从10到100，就得与人合作完成项目，进厂实习应该会好得多（积累一些技术之后可以开始）。
此处羡慕一下导师自己开公司的，从0到100直接打通，不同段位的都可以找到自己合适的角色，从实验室到规模化。
还是先去老老实实理解复现别人的工作吧

今日进度

看了一点Generative Model，主要是Boltzman Machine，但是对KL divergence并不了解，感觉是信息论的东西🤔已经在考虑直接去看Diffusion Model了，毕竟那个资源多

叠加态

8月19日（已健康上报）

（如果顺利的话）今天是在家最后一天
昨天查PageRank的资料，发现居然还是受李彦宏研发的RankDex算法启发才设计出来的，而且李彦宏团队还为此逆向工程过谷歌的算法，并验证了其没有抄袭RankDex，同时指出PageRank存在的缺点（即content farm之类的缺陷）。令人唏嘘的是，有着更好算法的百度，居然目前市值只有谷歌的1/10不到，而且在国内臭名昭著。不过也由此看出了百度的技术基因，难怪现在百度All in AI了
被要求给初中的小同学准备一个科普报告，想来想去，居然没有一个物理相关的orz
不过这几个都是自己曾经hands on 的一些小东西，简单的算法和简单的娱乐。说来感慨，在本科试图做一些有趣的实验，但被老师们批为“浪费时间做这些不如去跟着老师做科研”，现在回过头来，个人感觉还不如去做那些探索性的小实验，比如这种
可惜我四年级应该没时间，不然真想在学校推广这个项目，目前的一个想法，就是和zhl老师商量商量，改革一下物理实验。

今日进度

无，和同学聚会，明天回北京。
希望不要到了之后弹窗😇
如果那样的话，就告诉老师，希望能平安到达
另外，作为一所新学校缺乏track的问题，在升学的时候凸显了出来，不过又无可奈何，只能自己继续探索了

叠加态

8月20日（已健康上报）

本条消息最早发布于00:03:03，估计回北京要推迟一周了，那么接下来毫无疑问就是纯自学了，不过也不算太坏，还能多待一阵，和朋友父母一起也挺好
和大学里的朋友们很久没聚了，感觉有点疏离，三年了，似乎没有获得很强的归属感，这是我个人的问题吗？可能在学校太焦虑了，没法平常心生活吧
08:36:56发现还有弹窗，但本地病例上一个还是12号，今天已经20了，遂感慨精准防控的不精准，之后一周就在家学习了，希望效率不会太低

今日进度

Generative Model
Diffusion Model
哈哈，只看了一小时Generative和一小时Diffusion，数学没了解多少，走马观花被科普扫盲了一下
之前玩DALLE的时候没有细看论文，一直以为是用GAN（Generative Adversial Network）对抗生成网络做的，结果今天才知道用的Diffusion Model，里面本质上是马尔可夫过程，和一些神经网络。
不过还是有收获，了解了业界在普通神经网络的基础上进行魔改的诸多方法:一些normalization，一些attention，一些batch，residual之类的
下午去我哥（某厂程序员）家里吃饭，看他改业务代码，初步理解了被猪队友的屎山支配的感觉。
和朋友在四川音乐学院旁边的酒吧街转了一晚上，同学前几天刚从中金公司（那个据说员工平均年入百万的）参加活动回来，跟我讲了很多金融的东西，也聊了许多别的，感觉也是一种收获
夜里聊完，骑着摩托车回家，路灯闪烁，夜风吹扬，心情畅快。一想到回北京只能坐牢，没有生活可言，便又恨不得弹窗多来他十天半个月，如此，以后做数字游民的想法又强了一些。

叠加态

8月21日（已健康上报）

今日计划

复习概率论：Markov Chain，鞅等内容
复习数据挖掘：关联规则挖掘、图数据挖掘
整理资料：AI+Science领域的发展情况和重要事件

叠加态

8月22日

看了missing semister的两节课，惊觉shell和bash用起来如此方便。之前跑一个DFT的计算，写的脚本又臭又长，现在看来有很多可以提升的地方。
今天看到ICML2015的一篇文章：Deep Unsupervised Learning using Nonequilibrium Thermodynamics，利用非平衡热力学的深度无监督学习，惊讶于物理概念在ML中的无处不在，能量模型、朗之万方程、扩散过程……
MIT有一门课叫Introduction to Computational Thinking，非常有意思，真希望我能早点知道有这门课。这门课使用的语言是Julia，一个面向科学计算的高性能语言，之前就有打算想要学习一下，这门课应该是个好的开始。
copilot实在太强了，很多coding的问题，注释写清楚了之后代码基本无错误，微调一下就能run
昨天重读Page Rank的教材Google's PageRank and beyond，看到在书最后一节，作者引用了《悉达多》里悉达多给自己的朋友说的一段话：

When someone is seeking, it happens quite easily that he sees only the thing that he is seeking; that he is unable to find anything, unable to absorb anything, because he is only thinking of the thing he is seeking, because he has a goal, because he is obsessed with his goal.
Seeking means: to have a goal; but finding means: to be free, to be receptive, to have no goal. You, O worthy one, are perhaps indeed a seeker, for in striving towards your goal, you don't see many things that are under your nose.
Siddhartha

这本书，题目虽然是介绍一个算法，但是作者在卷首申明了，这是一本为本科生准备的，学习线性代数的书，并且也包含了足够“有趣”的内容，以至于数学基础偏少的读者也可领会要意。我个人十分推荐这本书作为线代的课后参考，看看一个可以商用的算法是如何用我们熟悉的线性代数导出的，看看各种概念如何应用于实际，我想对本科生来说很有启发。
而这段话，我没有领会到太多，为何作者要在这本精心撰写的书的最后，突兀地留下这段呢？
也许是要告诉我们，与其strive to seek and be obsessed with your goal, 不如be receptive, be open and find things that is hidden under your nose.
作为自然科学的本科生，回家有时候感觉会受到亲戚们的打量，毕竟我的所学无法直接帮到他们（不像医生和律师），而未入社会的我看起来对许多生活技能又不熟悉，远远不够成熟。在他们看来，我应该就是obsessed with my own goal的类型吧
读到这里有些思考，或许相比于沉浸在个人的世界里追逐所谓规律和真理，试着更多的介入和体验周遭的世界，体验不一样的视角和生活更能对我的成长有意义？

普通质粒

叠加态表示讲脚本那个老师的口音重得我真的听不懂，只能自己去看notes😇

Hiloxiko

楼主是如何做到每日保持极大的学习热情的？我现在陷入了每隔一段时间就摆烂的情况, 譬如一天内可能看论文写代码突然集中精神了一两个小时, 然后就会摆烂同等时间.

叠加态

Hiloxiko 恰恰相反，我其实没法做到每天保持极大热情，我的解决方案是在摆烂的时间做/学一些别的有意思的事情，这样就不觉得是在摆烂了😎No time is wasted.

IridiumLINCH-SK

Hiloxiko
讲道理，如果一个学者可以把一半的时间投入工作的话，那他确实已经打败绝大多数人了。