LunarMLの今年の進捗を振り返ります。
続きを読む「プログラミング」カテゴリーアーカイブ
LunarML: LuaやJavaScriptを出力するStandard MLコンパイラー
本日、私がこの数年開発しているStandard MLコンパイラー「LunarML」の最初のバージョン(v0.1.0)をリリースしました。というわけで、この記事ではLunarMLを紹介します。
はじめに
型のないプログラミング言語で大きなソフトウェアを作るのは辛いです。しかし、動作環境の都合で型のない言語を使わざるを得ない状況が世の中にはあります。この状況を改善できるのが、静的型のある言語で書かれたプログラムを型のない言語のコードへ変換するコンパイラーです。トランスパイラーと呼ばれることもあります。
WebではJavaScriptしか使えない状況が長く続いたため、JavaScriptへコンパイルする処理系は多数登場しました。しかし、それ以外のスクリプト言語、例えばLuaを出力するコンパイラーはまだ少ないように思います。そこで、静的型のある言語からLuaへ変換できるコンパイラーを新しく作ることにしました。
入力とする言語については、新しく作るのではなく、既存の言語を利用することにしました。私はML系の言語が好きなのでML系の言語をいくつか検討した結果、Standard MLを選びました。Standard MLは以下の特徴を持った言語です:
- 強力な型推論
- 正格評価
- カプセル化とコードの再利用を可能にするモジュールシステム
- 標準(The Definition)と、それに準拠した複数の処理系
機能
LunarMLはSML ’97の(モジュールシステムを含む)全ての機能と、Successor MLのいくつかの機能を実装しています。独自の拡張機能もいくつか実装しています。
標準ライブラリーはまだ不完全ですが、LunarML自身をコンパイルできる程度には揃っています。
複数ファイルからなるプロジェクトのために、MLtonやMLKitと互換性のあるML Basis systemを実装しています。
もちろん、LuaやJavaScriptの世界とのやりとりもできます。
いくつかのバックエンドでは、限定継続も利用できます。限定継続は非同期プログラミングに有用です。
ビルドとインストール
LunarMLは以下のGitHubリポジトリーで開発されています:
ビルドするにはMLtonとLuaが必要です。
$ git clone https://github.com/minoki/LunarML.git
$ cd LunarML
$ make
$ bin/lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!
インストールには make install
を使います。デフォルトでは /usr/local
にインストールされますが、PREFIX
変数を指定してインストール先を変更することもできます。
$ make install PREFIX=/opt/lunarml
$ export PATH=/opt/lunarml/bin:$PATH
$ lunarml --help
自分でビルドする代わりに、コンパイル済みスクリプト、もしくはDockerイメージを利用することもできます。コンパイル済みスクリプトはリリースされたtarballに含まれます。
コンパイル済みスクリプトをNode.jsで実行する場合の手順は次のようになります。
$ curl -LO https://github.com/minoki/LunarML/releases/download/v0.1.0/lunarml-0.1.0.tar.gz
$ tar xf lunarml-0.1.0.tar.gz
$ cd lunarml-0.1.0
$ make install-precompiled-node PREFIX=/opt/lunarml
$ export PATH=/opt/lunarml/bin:$PATH
$ lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!
スクリプトにコンパイルしたLunarMLはとても遅いので気をつけてください。実用の際はMLtonでネイティブコンパイルしたものを利用することをお勧めします。
Dockerイメージを利用する場合は次の手順になります。
$ docker pull ghcr.io/minoki/lunarml:latest
$ docker run --rm --platform linux/amd64 -v "$(pwd)":/work -w /work ghcr.io/minoki/lunarml:latest lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!
簡単なコードをコンパイルしてみる
Standard MLのHello worldは次のようになります:
print "Hello world!\n";
Luaにコンパイルしてみましょう。実行にはLua 5.3またはLua 5.4が必要です。
$ lunarml compile hello.sml
$ lua hello.lua
Hello world!
JavaScriptにコンパイルして、Node.jsで動かすこともできます:
$ lunarml compile --nodejs-cps hello.sml
$ node hello.mjs
Hello world!
フィボナッチ数を計算する(遅い)コードは以下のようになります:
fun fib 0 = 0
| fib 1 = 1
| fib n = fib (n - 1) + fib (n - 2);
print ("fib 10 = " ^ Int.toString (fib 10) ^ "\n");
$ lunarml compile --lua fib10.sml
$ lua fib10.lua
fib 10 = 55
$ lunarml compile --nodejs fib10.sml
$ node fib10.mjs
fib 10 = 55
標準で多倍長整数も使えます。Luaがターゲットの場合は自前の実装を、JavaScriptがターゲットの場合は BigInt
を使います。
fun fact 0 : IntInf.int = 1
| fact n = n * fact (n - 1);
print ("50! = " ^ IntInf.toString (fact 50) ^ "\n");
$ lunarml compile --lua fact50.sml
$ lua fact50.lua
50! = 30414093201713378043612608166064768844377641568960512000000000000
$ lunarml compile --nodejs fact50.sml
$ node fact50.mjs
50! = 30414093201713378043612608166064768844377641568960512000000000000
HaMLetをコンパイルしてみる
HaMLetという、Standard MLのリファレンス実装を謳う処理系があります。これをLunarMLで動かしてみましょう。
$ git clone https://github.com/rossberg/hamlet.git
$ cd hamlet/
$ make hamlet.mlb SYSTEM=mlton
$ lunarml compile --lua-continuations hamlet.mlb
$ lua hamlet.lua
HaMLet 2.0.0 - To Be Or Not To Be Standard ML
[loading standard basis library]
- 1 + 1;
val it = 2 : int
- OS.Process.exit OS.Process.success : unit;
もちろん、JavaScriptへコンパイルすることもできます。
$ lunarml compile --nodejs-cps hamlet.mlb
$ node hamlet.mjs
HaMLet 2.0.0 - To Be Or Not To Be Standard ML
[loading standard basis library]
- "Hello " ^ "world!";
val it = "Hello world!" : string
- OS.Process.exit OS.Process.success : unit;
Luaコードの生成
LunarMLはデフォルトではLua 5.3/5.4向けのコードを出力します。--lua
オプションで明示的に指定することもできます。
--luajit
オプションにより、LuaJIT向けコードを出力することもできます。
Luaの機能はLuaモジュールのAPIを介して呼び出すことができます。現状はあまり使いやすいものではないので、将来的にはもっと便利な方法を導入するかもしれません。
--lib
オプションにより、Luaモジュールを生成することもできます。export
という名前の変数またはモジュールで定義した内容がエクスポートされます。
出力されたコードは人間可読というわけではありません。人間可読なコードを生成するのは目標には入っていませんが、それでもデバッグの観点からもう少し読みやすいコードを生成したいです。
JavaScriptコードの生成
LunarMLはJavaScriptコードを出力することもできます。現状は実行にNode.jsが必要で、ブラウザーでは動きません。--nodejs
または --nodejs-cps
オプションを利用します。
Node.jsのAPIは多くが非同期的です。一方、Standard MLの入出力関数は同期的です。この違いを吸収するため、LunarMLは --nodejs-cps
オプションが利用された場合はプログラムに対してCPS変換と呼ばれる処理を行っています。--nodejs
オプションが指定された場合はCPS変換を行わず、代わりに入出力関数を制限しています。
JavaScriptの機能はJavaScriptモジュールのAPIを介して呼び出すことができます。これも、将来的にはもっと便利な方法を導入するかもしれません。
--lib
オプションにより、ESモジュールを生成することもできます。export
という名前の変数またはモジュールで定義した内容がエクスポートされます。
LunarMLの標準の文字列型 string
はJavaScriptの世界では Uint8Array
を使って表現されます。JavaScriptの文字列はLunarMLでは WideString.string
型として利用できます。
今後の計画
LunarMLはまだまだ未完成で、今後実装したい機能はたくさんあります。いくつか挙げます。
- 標準ライブラリーの充実
- Successor MLの機能をより多く実装する
- REPLとインタープリター
- Online compiler
- バックエンドの追加
- ブラウザー向けJavaScript
- PHP
- WebAssembly with GC
- パッケージ管理システム
最後に、GitHubのリポジトリにスターを頂けると嬉しいです:
「型システム入門」の先へ:TypeScriptの型システムのいくつかの側面
この記事は TypeScript Advent Calendar 2023 の8日目の記事です。言語実装勢にも役立つ内容を含んでいるかもしれないので、 言語実装 Advent Calendar 2023 にも登録しています。
TypeScriptで型システムに興味を持った人が「型システム入門」を読んだという話を時々聞きます。「型システム入門」は、Types and Programming Languages (TAPL) という本の邦訳で、型システムに興味を持った人が読むのは自然なことです。
ですが、この本の原著は2002年出版で、最近の話題がカバーされていなかったり、邦題に「入門」とあるように発展的な話題は扱っていなかったりします。一応続編的な感じのAdvanced Topics in Types and Programming Languages (ATTAPL) という本はありますが、これも2004年なので最近の話題はカバーされていません。
- Advanced Topics in Types and Programming Languages(編者のページ)
- Advanced Topics in Types and Programming Languages(出版社のページ)
そして、TypeScriptの型システムは最近の型の理論/技術をちょいちょい使っています。
そういうわけで、私としては、TypeScriptで型システムに興味を持った人が辿り着くのが「型システム入門」止まりで本当に良いのか、という気持ちがあります。「型システム入門」の先を見たくはありませんか?
残念ながら私は型理論の専門家ではなく、高度な型システムの理論的な説明はとても書けません。なので、この記事ではTypeScriptの型システムのいくつかの側面を紹介し、文献へのポインターを提示することにします。
なお、私はTypeScriptの実装は読んでいません。あくまでドキュメントや挙動を見て判断しています。
続きを読むGHCへの私の貢献2023
この記事は Haskell Advent Calendar 2023 の6日目の記事です。
私はここ数年、HaskellコンパイラーであるGHCに貢献しています。この記事では、今年(2023年)に私が行った貢献を紹介します。
GHCの開発は独自ホストされたGitLab上で行われています。
続きを読むLunarML進捗・2023年9月
アルゴリズムの擬似コードと関数型言語
アルゴリズムの擬似コードを書く際は、いわゆる手続き型のスタイルで書くことが多いかと思います。つまり、更新可能な変数とループを使います。
一方、私がよく書くのは関数型言語で、これは更新可能な変数やループの代わりに末尾呼び出しを使用します。
では、アルゴリズムを提示してそれを関数型言語で実装する、というスタイルの文章を書く場合、アルゴリズムの擬似コードはどう書けばいいのでしょうか?
(ここでは、アルゴリズムの停止性、計算量、不変条件の明示等の観点から擬似コードの方が有益であり、関数型のコードだけを書けば良いというものではない、という立場を取ります。)
続きを読むUniversal MachineのJITコンパイラーを書いた/x86_64編
前にこういう記事を書きました:
かいつまんで説明しておくと、Universal Machineというのは2006年のICFP Programming Contestで挑戦者が実装する必要のあるVMです。これは速ければ速いほどいいので、JITコンパイルに挑戦したくなります。2年前の記事ではAArch64向けのJITコンパイラーを書きました(私の家の最速マシンがM1 Macだったので)。
時は流れ、私の家の最速のマシンはM1 MacからRyzen搭載ミニPCへ交代しました。なので、x86_64版のJITコンパイラーも書きたくなりました。
今回対応したのはUnix系で、Windows版は未実装です。
続きを読むHaskell/GHCのSIMDについて考える
最近のコンピューターの性能を活用するには、何らかの並列化が必須です。具体的にはSIMDの活用やマルチコア(それとGPU)です。プログラミング言語でこれらを利用できれば「C言語よりも速い」を名乗れます。この記事では並列化技術のうち、SIMDを考えます。
HaskellコンパイラーであるGHCにはSIMDのプリミティブ(データ型と関数)が実装されています。しかし、広く使われているとは言い難いです。
続きを読むLunarML進捗・2023年6月
Pythonについて思うこと
みなさん、Pythonは好きですか?
この記事では、私がPythonという言語とそのエコシステムについて思うところを書いていきます。全体を通したストーリーみたいなのはなくて、トピックごとに書いています。
私のPython経験は3年弱です。Pythonについてまだまだ新米だという自覚はありますが、そこは有り余る才能でカバーしてこの記事を書いています。
続きを読む