MMA 的不完全指南

凉凉

Assuming 函数

如果想要积一些比较麻烦的积分, 或者是想要让结果更加好看一点的话, 请务必不要错过这个函数 Assuming.

举一个例子: 如果想要进行这样一个复杂积分:

$\langle \frac{1}{| \boldsymbol{r}1 - \boldsymbol{r}2 |} \rangle = \int{r_1} \int{r_2} \frac{1}{\sqrt{r_1² + r_2² - 2r_1 r_2 \cos \theta_2}} (\frac{8}{\pi a³} e^{-2 (r_1 + r_2) / a})² (2 \pi r_2² \sin \theta_2) \mathrm{d}r_2 \mathrm{d}\theta_2 (4 \pi) \mathrm{d}r_1$

(不清楚是否 LaTeX 能渲染出来 💦)

除了手动告知 MMA 积分顺序以外, 可以通过 Assuming 函数来约束 Mathematica 在尝试积分的时候用的规则集, 这样除了可以加速积分速度, 有时候还能够让一些不能被积分的积分给积分出来. 比如:

Assuming[r1 != r2 && r1 > 0 && r2 > 0, 
 Integrate[Sin[theta2]/
  Sqrt[r1^2 + r2^2 - 2*r1*r2*Cos[theta2]], {theta2, 0, Pi}]

通过添加约束使得 MMA 在正 (实) 数范围进行积分, 并且两个变量 r1 和 r2 并不相同. (这样可以让积分速度变快)

同样, 因为 MMA 默认会在尽可能大的数域 (复数) 进行积分, 有时候积分出来的结果或者积分本身都不是很让人满意, 这个时候你可以通过 Assuming 的方式进行添加约束, 比如:

Assuming[Element[x, Reals], 
  (* Expr *)]

约束变量 x 在实数域进行积分 (Element 的快捷输入是 ESC in ESC, 最终的效果就是 $x \in \mathrm{Reals}$)

Assuming 还能够用来进行表达式的化简, 比如通过添加约束可以使得某些不能被 Simplify 或者是 FullSimplify 的表达式进一步进行化简. (虽然有时候看起来挺没用的, 因为人眼可以观察进行化简, 但是至少也是一个功能嘛)

总结: 在表达式层面上: Assuming[ 假设成立的表达式, 要计算的表达式 ].

最后: 如果你想要进行全局的规则约束, 那么则可以通过定义 $Assumptions 的方式来进行, 如: $Assumptions = Element[x, Reals] && x > 0. 尽管不建议如此.

凉凉

计算顺序

虽然这个是一个本来计算机科学导论课上就会讲的东西, 但是因为平时不太会注意到这种东西, 所以经常会出现一些因为计算顺序而产生的小 bug.

一个稍微有点复杂的例子

注: 该例子有些麻烦, 直接跳过代码也行.

举一个例子, 众所周知, Mathematica 默认你在 Complex (复数) 里面进行运算, 尽管你可以使用 Assuming 函数去约束 (见上 Assuming 一节凉凉), 但是如果你想要自己写函数去调用的话, 那么就会出现一些奇妙的 bug. 比如说以下面这个为例:

unify[phi_, c_, xRange_, dom_] := 
  Solve[Integrate[Refine[Conjugate[phi]*phi, dom], xRange] == 1, c, 
   dom];
unify[phi_, c_, xRange_, dom_, assumption_] := 
  Assuming[assumption, unify[phi, c, xRange, dom]];

假如直接进行计算: unify[A * Exp[- b x^2, A, {x, -Infinity, Infinity}, Reals, b > 0] 的话, 得到的结果可能并不是你想要的结果.

这是因为 Mathematica (以及和其他大多数计算机语言一样), 在运算的时候应该是先计算好传入的参数的值, 然后再将值作为函数的参数依次传入 (应用序). (至于从左到右还是从右到左这种细节应该是不重要的)

那么在上面的过程里面, 就会导致 b > 0 先被计算 (当作一个逻辑判断式) 之后再传入函数内计算 (应该), 于是出来的结果就会非常令人头大.

一个简单的解决方法就是告诉 Mathematica 你先别急, 先对函数进行展开之后再计算. (过程序).

ClearAll[unify];
SetAttributes[unify, HoldAll];
unify[phi_, c_, xRange_] := 
  Solve[Integrate[Conjugate[phi]*phi, xRange] == 1, c];
unify[phi_, c_, xRange_, dom_] := 
  Solve[Integrate[Refine[Conjugate[phi]*phi, dom], xRange] == 1, c, 
   dom];
unify[phi_, c_, xRange_, dom_, assumption_] := 
  Assuming[assumption, unify[phi, c, xRange, dom]];

其中 SetAttributes[unify, HoldAll] 的作用就是为了告诉 Mathematica unify 这个函数的参数先不要求值, 在表达式展开后再进行求值.

想要了解更多的话可以看看这个链接: Metaprogramming in Wolfram Language. 里面主要介绍了如何在 Mathematica 中使用 Hold 类似的技术来实现类似于 Lisp 中的 Macro (宏), 或者说运行时代码生成的技术.

ProfessorX 这不是看完标题就知道了吗（

(我摊牌了: 这就是量子力学作业计算用的 ~~手动狗头~~)

稍微普通一点的例子

当然, 上面这个例子可能有些极端了 (毕竟大部分用 Mathematica 的人可能并不会去写函数).

注: 暂时还没有想到啥比较好的. 以后再说.

简单的总结

计算顺序:
- 计算参数 -> 计算函数 (应用序)
- 展开函数 -> 计算 (正则序)
Hold, ReleaseHold, HoldAll, 等可以在 Mathematica 中实现改变计算顺序从而实现运行时生成代码

凉凉

MMA 的多高斯拟合

一些预备的代码 (数据读取, 格式转化之类的)

读取数据

    dat = MapIndexed[(Reverse@(First /@ {##})) &, Import["./dat/120.txt", "Data"]];

这个数据的类型类似于:

当然, 也可以通过 awk 来进行处理: awk '{print NR ", " $1}' < 120.txt > 120.csv 然后再读取会方便一点...

设定拟合区间
```
    min = 40; max = 80;
```
可以通过 ListLinePlot 函数来进行预览 dat 中的数据, 通过鼠标确认应该拟合的峰的位置, 通过 ListLinePlot[ dat, PlotRange -> {{xMin, xMax}, {yMin, yMax}} ] 来修改绘图区间.
设置一个要拟合的模型: 这里认为是一个多高斯分布形成的峰 (当然也可以是线性基底和高斯峰, 或者是别的分布都可以, 朗道分布的峰也没问题, 只要把 NormalDistribution 替换掉就好. 其中未指定的都是将要用来拟合的参数.
```
    model1 = a1*PDF[NormalDistribution[mu1, sigma1], x];
    model2 = a2*PDF[NormalDistribution[mu2, sigma2], x];
    model3 = a3*PDF[NormalDistribution[mu3, sigma3], x];
    model = model1 + model2 + model3;
```

拟合与应用拟合的结果

MMA 里面有一堆拟合用的函数, 不同的函数效果还不太一样 (这里的建议是每个都试试 💦, 毕竟是玄学的调参) 这里以 FindFit (文档为例):
```
    fit = FindFit[dat[[min ;; max]], model,
                  {a1, mu1, sigma1, a2, mu2, sigma2, a3, mu3, sigma3}, x, 
                  Method -> NMinimize];
```
注意这里 Method -> NMinimize 是为了更好地去拟合 (做法就是去找全局最小值了. 文档).
fit 的形式是一个 { dummyVariable -> Value, ... } 的形式, 所以你可以用 Replace 函数来将拟合结果应用到表达式上用于进一步处理分析:
```
    fitted = model /. fit;
    fitted1 = model1 /. fit;
    fitted2 = model2 /. fit;
    fitted3 = model3 /. fit;
```

结果绘图和导出

    plt = Show[
      Plot[{fitted, fitted1, fitted2, fitted3},
           {x, min, max}, PlotRange -> {{0, 100}, All},
           PlotLegends -> {"拟合结果", "高斯1", "高斯2", "高斯3"}],
      ListPlot[dat, PlotStyle -> Red, PlotLegends -> {"原始数据"}]];
    Export["./img/fit-120-3.png", plt];

Image description

进一步拟合?

如果发现拟合效果一般, 或者还想要稍微微调一些参数去重新拟合怎么办?

请修改参数列表: {{mu1, 0.1}, ...} 以 {dummyVariable, initValue} 的形式来表示数据.
换用其他的函数: LinearModelFit, NoneLinearModelFit 等等

Aluria

凉凉如果发现拟合效果一般, 或者还想要稍微微调一些参数去重新拟合怎么办?
请修改参数列表: {{mu1, 0.1}, ...} 以 {dummyVariable, initValue} 的形式来表示数据.
换用其他的函数: LinearModelFit, NoneLinearModelFit 等等

关于 MMA 拟合的更多内容

NonlinearModelFit 和 FindFit 在 MMA 内部是一样的，区别只在于参数的形式不同，但最终拟合的结果不会更好或更坏。

LinearModelFit 是真的线性拟合，你需要指定 {f1[x], f2[x], .., fk[x]} ，MMA 会帮你线性组合这几个函数，达到平方误差最小的拟合。

如何得到更好的拟合结果

一方面可以手动调初值，拟合基本上是从初值开始（默认似乎是 0 ），使用的是局部最小值的算法。因此在很多情况下，局部最小就需要调整到一个合适的初值，使得从该初值出发，诸如梯度下降等算法可以达到最小值点。

但如果你不想手动调初值，或者你想写一个稍微通用些的算法，那就需要尝试从局部最优跳出来，到达全局最优。

可以参考MMA官方的关于全局最优的教程：数值非线性全局最优化其中也提到了一些不同算法。下面主要以退火算法 Simulated Annealing 为例。

我们先生成一个较为复杂的函数（这是在官方文档中介绍退火算法的函数），并生成 200 个样本点。

f[x_, y_] := 
  20 Sin[\[Pi]/2 (x - 2 \[Pi])] + 
   20 Sin[\[Pi]/2 (y - 2 \[Pi])] + (x - 2 \[Pi])^2 + (y - 2 \[Pi])^2;
Plot3D[f[x, y], {x, 0, 10}, {y, 0, 10}]
data = Table[
   With[{x = RandomReal[]*10, y = RandomReal[]*10}, {x, y, 
     f[x, y]}], {i, 0, 200}];

Image description

我们如果想获取一个函数的最小值，需要使用 NMinimize 函数，如下：

In[]  = NMinimize[f[x, y], {x, y}, 
 Method -> {"SimulatedAnnealing", "PerturbationScale" -> 7}]
Out[] = {-38.0779, {x -> 5.32216, y -> 5.32216}}

可以看到，NMinimize 找到了一个局部最优解后，就误以为自己找到了全局最优，在很远处就结束掉了。
我们需要使用退火算法，让 NMinimize 更好的寻找结果。（退火算法的详细介绍自己看wiki或者上计算物理课）

In[]  = NMinimize[f[x, y], {x, y}]
Out[] = {8.0375, {x -> 1.48098, y -> 1.48098}}

那么问题来了，这只是寻找函数的最小值，和 NonlinearModelFit 有什么关系呢？有的，因为 NonlinearModelFit 内部就需要调用 Minimize 算法，找到一组参数，使均方误差最小。我们只需要告诉 MMA ，寻找最小值时，使用退火算法来寻找就可以了。

先看一下如果没有任何算法，会怎样：

nlm = NonlinearModelFit[data, 
   a1 Sin[k1 x + b1] + 
    a2 Sin[k2 y + b2] + (x - c1)^2 + (y - c2)^2, {a1, a2, k1, k2, b1, 
    b2, c1, c2}, {x, y}];
nlm["BestFitParameters"]
Plot3D[nlm[x, y], {x, 0, 10}, {y, 0, 10}]

{a1 -> -1.52271, a2 -> 3.39773, k1 -> 10.3748, k2 -> 8.19673, 
 b1 -> -52.2501, b2 -> -44.6849, c1 -> 6.26415, c2 -> 6.28012}

Image description

可以看出来，拟合似乎是把二次函数的中心位置找到了，但是正弦函数的拟合就很糟糕。
下面简单的引入退火算法，需要让 NonlinearModelFit 在内部使用 NMinimize 算法并且极小值算法为 SimulatedAnnealing 。这可以使用 Method 设置，Method 的进阶的参数形式如下

      	{name1, Method->{name2, ...}}	用方法和子方法

因此使用MMA代码，使用 NMinimize 方法和它的子方法 "SimulatedAnnealing"：

nlm = NonlinearModelFit[data, 
   a1 Sin[k1 x + b1] + 
    a2 Sin[k2 y + b2] + (x - c1)^2 + (y - c2)^2, {a1, a2, k1, k2, b1, 
    b2, c1, c2}, {x, y}, 
   Method -> {"NMinimize", Method -> "SimulatedAnnealing"}];
nlm["BestFitParameters"]
Plot3D[nlm[x, y], {x, 0, 10}, {y, 0, 10}]

{a1 -> -20.717, a2 -> -3.5992, k1 -> 1.57375, k2 -> -4.21244*10^-8, 
 b1 -> -0.389284, b2 -> 2.37695, c1 -> 6.2613, c2 -> 6.37348}

Image description

可以发现，我们成功地找到了一组的正弦，但是没有找到全部的最优解。这个时候可以调整更多的参数来完成：

nlm = NonlinearModelFit[data, 
   a1 Sin[k1 (x - b1)] + 
    a2 Sin[k2 (y - b2)] + (x - c1)^2 + (y - c2)^2, {a1, a2, k1, k2, 
    b1, b2, c1, c2}, {x, y},
   Method -> {"NMinimize", 
     Method -> {"SimulatedAnnealing", "PerturbationScale" -> 5}}];
nlm["BestFitParameters"]
Plot3D[nlm[x, y], {x, 0, 10}, {y, 0, 10}]

{a1 -> 20., a2 -> -20., k1 -> 1.5708, k2 -> -1.5708, b1 -> -5.71682, 
 b2 -> 6.28319, c1 -> 6.28319, c2 -> 6.28319}

Image description

非常棒！现在所有的参数都达到预期了。

更多更复杂的函数的退火可能需要更多的退火的参数，还是看上面给出的参考文档的链接就可以了。它里面也给出了退火算法可以设置的方法

选项名	默认值	说明
"BoltzmannExponent"	Automatic	概率函数的指数
"InitialPoints"	Automatic	初始点集
"LevelIterations"	50	停留在某一给定点的最大迭代次数
"PenaltyFunction"	Automatic	用于约束条件以惩罚无效点的函数
"PerturbationScale"	1.0	随机跳转的尺度
"PostProcess"	Automatic	是否利用局部搜索方法进行后处理
"RandomSeed"	0	随机数字生成器的初始值
"SearchPoints"	Automatic	初始点的数目
"Tolerance"	0.001	接受对约束违反程度的宽限

如果简单的退火不能达到要求，调整一下退火的具体方法就差不多可以了。

凉凉

Permutations

或者用大家更加熟悉一些的名词来说: 置换. (官方文档: Permutations)

注: 提及这个函数的唯一原因就是懒得算以及想要更加通用的计算函数而已. ~~虽然估计看下面的例子就会被人看出来是在写啥的代码了, 但是还是保密代码的用途吧 💦~~

对于一个序列 {1, 2, 3}, 其所有可能的排列方式如下:

In[469]:= Permutations[{1, 2, 3}]

Out[469]= {{1, 2, 3}, {1, 3, 2}, {2, 1, 3}, {2, 3, 1}, {3, 1, 2}, {3, 2, 1}}

于是可以构造一个 $S_N$ 函数来表示 $n$ 个数的所有的组合顺序:

sN[n_Integer] := Permutations[Table[i, {i, n}]];

有了组合顺序, 于是就可以知道一个组合的逆序数 (PermutationOrder) 了, 不过这里仅仅关心其符号 (奇偶性):

Signature[{1, 2, 3}] (* => 1 *)
Signature[{2, 1, 3}] (* => -1 *)

于是就可以构造一个计算函数用来表示这样的一个算符: $P{anti}(\phi{n} (x{i})) = \frac{1}{\sqrt{N!}} \sum{\pi \in S_N} sgn(\pi) \pi \circ \phi(x_i)$

antiP[phi_, x_List] := 
  Total[(Signature[#] * phi @@ Permute[x, #])& /@ sN[Length[x]]] / Sqrt[Length[x]!]

代码解释:

f @@ {1, 2, 3} 表示将之后的列表元素作为 f 的参数依次传入 f[1, 2, 3].
f /@ {1, 2, 3} 表示将列表中的元素依次作用 f: {f[1], f[2], f[3]}
(... # ...)& 表示将 & 前的一堆表达式作为一个函数, 其中函数的输入用 # 来表示
所以上面的代码就是将 sN 得到的所有的排序 $\pi$ 应用到 $\phi$ 上并进行求和, 对和除一个常数

使用这个函数很容易构造一个费米子的波函数的计算函数. 以 $\phi = \sqrt{\frac{2}{a}} \sin (n \pi x / a)$ 为例:

antiP[(Sin[a*Pi*#1/l] Sin[b*Pi*#2/l]) &, {x1, x2}]

(当然, 你可以写一写生成 phi 的函数来生成这个东西, 这就挺无聊的, 想必大家也不是很爱听就是了)

ProfessorX

凉凉注: 提及这个函数的唯一原因就是懒得算以及想要更加通用的计算函数而已. 虽然估计看下面的例子就会被人看出来是在写啥的代码了, 但是还是保密代码的用途吧

这不是看完标题就知道了吗（

凉凉

MMA 的网络超时处理

Mathematica 里面有一个小小的功能就是用来和 Wolfram Alpha 链接, 来快速查找一些常量, 一些数据的 (比如 Ctrl-= 可以启动 “自然语言” 输入, 比如 Ctrl-= 后在输入框中输入 planck constant 后按下回车, 就会得到一个 Planck 常数; 比如 Ctrl-= 后在输入框中输入 muon mass, 就会自动返回一个查询语句来查询数据库中的 $\mu$ 子的质量的代码... 复杂一点的比如 Wolfram Alpha 的查询:

Image description

但是有时候你会发现, Wolfram 的这个服务器的连接体验是一言难尽, 有时候可以连接上, 大部分情况下相当于没有. ~~救赎之道自然是开梯子~~:

打开 Mathematica 的设置
在 Internet & Mail 中, 找到 Proxy Settings, 接下来, 呃, 大家看着办, 下面这张图片是网络上找到的, 与我没有一点关联, 我用校园网就够了, 不知道什么是梯子.

Image description

注: 可以通过 Test Internet Connectivity 来测试是否连接通顺, 可以用来判断是否正常连接.

啊, 但是貌似下载的时候, 没法单独设置代理的样子, 所以如果下载的时候遇到超时问题, 可以选择 Direct File Download. 或者考虑使用一些不那么正规的渠道下载一个安装包, 然后再去激活.

« 上一页