投稿者「mod_poppo」のアーカイブ

LunarML: LuaやJavaScriptを出力するStandard MLコンパイラー

本日、私がこの数年開発しているStandard MLコンパイラー「LunarML」の最初のバージョン(v0.1.0)をリリースしました。というわけで、この記事ではLunarMLを紹介します。

はじめに

型のないプログラミング言語で大きなソフトウェアを作るのは辛いです。しかし、動作環境の都合で型のない言語を使わざるを得ない状況が世の中にはあります。この状況を改善できるのが、静的型のある言語で書かれたプログラムを型のない言語のコードへ変換するコンパイラーです。トランスパイラーと呼ばれることもあります。

WebではJavaScriptしか使えない状況が長く続いたため、JavaScriptへコンパイルする処理系は多数登場しました。しかし、それ以外のスクリプト言語、例えばLuaを出力するコンパイラーはまだ少ないように思います。そこで、静的型のある言語からLuaへ変換できるコンパイラーを新しく作ることにしました。

入力とする言語については、新しく作るのではなく、既存の言語を利用することにしました。私はML系の言語が好きなのでML系の言語をいくつか検討した結果、Standard MLを選びました。Standard MLは以下の特徴を持った言語です:

  • 強力な型推論
  • 正格評価
  • カプセル化とコードの再利用を可能にするモジュールシステム
  • 標準(The Definition)と、それに準拠した複数の処理系

機能

LunarMLはSML ’97の(モジュールシステムを含む)全ての機能と、Successor MLのいくつかの機能を実装しています。独自の拡張機能もいくつか実装しています。

標準ライブラリーはまだ不完全ですが、LunarML自身をコンパイルできる程度には揃っています。

複数ファイルからなるプロジェクトのために、MLtonやMLKitと互換性のあるML Basis systemを実装しています。

もちろん、LuaやJavaScriptの世界とのやりとりもできます。

いくつかのバックエンドでは、限定継続も利用できます。限定継続は非同期プログラミングに有用です。

ビルドとインストール

LunarMLは以下のGitHubリポジトリーで開発されています:

ビルドするにはMLtonとLuaが必要です。

$ git clone https://github.com/minoki/LunarML.git
$ cd LunarML
$ make
$ bin/lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!

インストールには make install を使います。デフォルトでは /usr/local にインストールされますが、PREFIX 変数を指定してインストール先を変更することもできます。

$ make install PREFIX=/opt/lunarml
$ export PATH=/opt/lunarml/bin:$PATH
$ lunarml --help

自分でビルドする代わりに、コンパイル済みスクリプト、もしくはDockerイメージを利用することもできます。コンパイル済みスクリプトはリリースされたtarballに含まれます。

コンパイル済みスクリプトをNode.jsで実行する場合の手順は次のようになります。

$ curl -LO https://github.com/minoki/LunarML/releases/download/v0.1.0/lunarml-0.1.0.tar.gz
$ tar xf lunarml-0.1.0.tar.gz
$ cd lunarml-0.1.0
$ make install-precompiled-node PREFIX=/opt/lunarml
$ export PATH=/opt/lunarml/bin:$PATH
$ lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!

スクリプトにコンパイルしたLunarMLはとても遅いので気をつけてください。実用の際はMLtonでネイティブコンパイルしたものを利用することをお勧めします。

Dockerイメージを利用する場合は次の手順になります。

$ docker pull ghcr.io/minoki/lunarml:latest
$ docker run --rm --platform linux/amd64 -v "$(pwd)":/work -w /work ghcr.io/minoki/lunarml:latest lunarml compile example/hello.sml
$ lua example/hello.lua
Hello world!

簡単なコードをコンパイルしてみる

Standard MLのHello worldは次のようになります:

print "Hello world!\n";

Luaにコンパイルしてみましょう。実行にはLua 5.3またはLua 5.4が必要です。

$ lunarml compile hello.sml
$ lua hello.lua
Hello world!

JavaScriptにコンパイルして、Node.jsで動かすこともできます:

$ lunarml compile --nodejs-cps hello.sml
$ node hello.mjs
Hello world!

フィボナッチ数を計算する(遅い)コードは以下のようになります:

fun fib 0 = 0
  | fib 1 = 1
  | fib n = fib (n - 1) + fib (n - 2);
print ("fib 10 = " ^ Int.toString (fib 10) ^ "\n");
$ lunarml compile --lua fib10.sml
$ lua fib10.lua
fib 10 = 55
$ lunarml compile --nodejs fib10.sml
$ node fib10.mjs
fib 10 = 55

標準で多倍長整数も使えます。Luaがターゲットの場合は自前の実装を、JavaScriptがターゲットの場合は BigInt を使います。

fun fact 0 : IntInf.int = 1
  | fact n = n * fact (n - 1);
print ("50! = " ^ IntInf.toString (fact 50) ^ "\n");
$ lunarml compile --lua fact50.sml
$ lua fact50.lua
50! = 30414093201713378043612608166064768844377641568960512000000000000
$ lunarml compile --nodejs fact50.sml
$ node fact50.mjs
50! = 30414093201713378043612608166064768844377641568960512000000000000

HaMLetをコンパイルしてみる

HaMLetという、Standard MLのリファレンス実装を謳う処理系があります。これをLunarMLで動かしてみましょう。

$ git clone https://github.com/rossberg/hamlet.git
$ cd hamlet/
$ make hamlet.mlb SYSTEM=mlton
$ lunarml compile --lua-continuations hamlet.mlb
$ lua hamlet.lua
HaMLet 2.0.0 - To Be Or Not To Be Standard ML
[loading standard basis library]
- 1 + 1;
val it = 2 : int
- OS.Process.exit OS.Process.success : unit;

もちろん、JavaScriptへコンパイルすることもできます。

$ lunarml compile --nodejs-cps hamlet.mlb
$ node hamlet.mjs
HaMLet 2.0.0 - To Be Or Not To Be Standard ML
[loading standard basis library]
- "Hello " ^ "world!"; 
val it = "Hello world!" : string
- OS.Process.exit OS.Process.success : unit;

Luaコードの生成

LunarMLはデフォルトではLua 5.3/5.4向けのコードを出力します。--lua オプションで明示的に指定することもできます。

--luajit オプションにより、LuaJIT向けコードを出力することもできます。

Luaの機能はLuaモジュールのAPIを介して呼び出すことができます。現状はあまり使いやすいものではないので、将来的にはもっと便利な方法を導入するかもしれません。

--lib オプションにより、Luaモジュールを生成することもできます。export という名前の変数またはモジュールで定義した内容がエクスポートされます。

出力されたコードは人間可読というわけではありません。人間可読なコードを生成するのは目標には入っていませんが、それでもデバッグの観点からもう少し読みやすいコードを生成したいです。

JavaScriptコードの生成

LunarMLはJavaScriptコードを出力することもできます。現状は実行にNode.jsが必要で、ブラウザーでは動きません。--nodejs または --nodejs-cps オプションを利用します。

Node.jsのAPIは多くが非同期的です。一方、Standard MLの入出力関数は同期的です。この違いを吸収するため、LunarMLは --nodejs-cps オプションが利用された場合はプログラムに対してCPS変換と呼ばれる処理を行っています。--nodejs オプションが指定された場合はCPS変換を行わず、代わりに入出力関数を制限しています。

JavaScriptの機能はJavaScriptモジュールのAPIを介して呼び出すことができます。これも、将来的にはもっと便利な方法を導入するかもしれません。

--lib オプションにより、ESモジュールを生成することもできます。export という名前の変数またはモジュールで定義した内容がエクスポートされます。

LunarMLの標準の文字列型 string はJavaScriptの世界では Uint8Array を使って表現されます。JavaScriptの文字列はLunarMLでは WideString.string 型として利用できます。

今後の計画

LunarMLはまだまだ未完成で、今後実装したい機能はたくさんあります。いくつか挙げます。

  • 標準ライブラリーの充実
  • Successor MLの機能をより多く実装する
  • REPLとインタープリター
  • Online compiler
  • バックエンドの追加
    • ブラウザー向けJavaScript
    • PHP
    • WebAssembly with GC
  • パッケージ管理システム

最後に、GitHubのリポジトリにスターを頂けると嬉しいです:

「型システム入門」の先へ:TypeScriptの型システムのいくつかの側面

この記事は TypeScript Advent Calendar 2023 の8日目の記事です。言語実装勢にも役立つ内容を含んでいるかもしれないので、 言語実装 Advent Calendar 2023 にも登録しています。


TypeScriptで型システムに興味を持った人が「型システム入門」を読んだという話を時々聞きます。「型システム入門」は、Types and Programming Languages (TAPL) という本の邦訳で、型システムに興味を持った人が読むのは自然なことです。

ですが、この本の原著は2002年出版で、最近の話題がカバーされていなかったり、邦題に「入門」とあるように発展的な話題は扱っていなかったりします。一応続編的な感じのAdvanced Topics in Types and Programming Languages (ATTAPL) という本はありますが、これも2004年なので最近の話題はカバーされていません。

そして、TypeScriptの型システムは最近の型の理論/技術をちょいちょい使っています。

そういうわけで、私としては、TypeScriptで型システムに興味を持った人が辿り着くのが「型システム入門」止まりで本当に良いのか、という気持ちがあります。「型システム入門」の先を見たくはありませんか?

残念ながら私は型理論の専門家ではなく、高度な型システムの理論的な説明はとても書けません。なので、この記事ではTypeScriptの型システムのいくつかの側面を紹介し、文献へのポインターを提示することにします。

なお、私はTypeScriptの実装は読んでいません。あくまでドキュメントや挙動を見て判断しています。

続きを読む

GHCへの私の貢献2023

この記事は Haskell Advent Calendar 2023 の6日目の記事です。


私はここ数年、HaskellコンパイラーであるGHCに貢献しています。この記事では、今年(2023年)に私が行った貢献を紹介します。

GHCの開発は独自ホストされたGitLab上で行われています。

続きを読む

さようなら、Evernote

Evernoteがまた改悪するらしい。

この前に値上げのニュースがあって、Personalプランが年額5200円から9300円に値上がりする。流石にこの値上げ幅はきつい。私の次回更新は数日後なので、PersonalをやめてFreeプランにするつもりだった。Freeプランでは同期できる台数にきつい制限があるので、どのみちEvernoteは常用をやめるつもりだ。過去のノートの参照には使うかもしれない。

私がEvernoteを使い始めたのは2010年だったらしい。13年間の長い付き合いだった。

Evernoteのデスクトップアプリを使うとノートをエクスポートできる。Freeプランは今回の改悪後も参照はできるようだが、念の為、HTMLにエクスポートした。

ノートテイキングアプリは何が便利だったか。私が求めるのは

  • 気軽に記入できること
  • 検索できること
  • 複数端末で同期できること

あたりだろうか。Evernoteにはノートブックという分類の仕組みがあるが、最近はあまり活用していない。ユーザーに分類させるのはユーザーの時間を消費するので、分類はAIがやるか、検索機能を強力にする等で対応するべきだと思う。

今後何を使うか。最近流行りなのはNotionというやつだろうか。しかし、いまいち新しいサービスを試す気力が湧かない。

登山計画書など、他人と共有する必要のある文書は最近はGoogleドキュメントで書いている。個人用のメモもGoogleドキュメントで良いのではないか。しばらくGoogleドキュメントを常用してみて、「気軽さ」「検索性」を確かめてみたい。

Appleのメモアプリというのもある。iPhoneの購入により手持ちの端末が大体Apple製になったのでこれもアリだ。しかしいざという時のエクスポートの容易性はよくわからない。

皇海山登山

今年の秋は安達太良山(福島県)や八溝山(茨城県・福島県)に登ったが、いまいち満足できなかった。シーズンが終わる前にもう一個くらいガッツリした山に登りたい。

ということで、前から気になっていた皇海山すかいさん(栃木と群馬の県境、渡良瀬川源流、足尾の主)に行くことにした。皇海山は日本百名山だが、コースタイムがかなり長い(最寄りの山小屋から山頂まで往復10時間)上に山頂の展望はない、マニアックな山という印象である。

数年前までは群馬側の林道を使って日帰りでも行けたようだが、その林道は通行不可になり、今は(バリエーションルートを除けば)事実上栃木側からの「クラシックルート」一択である。それも登山地図には一部が破線で表示されている。

皇海山は栃木県の山のグレーディングでは最難関(D;グレーディングの技術的難易度としてはAからEまでがある)とされている。地図に登山道が載らない錫ヶ岳よりも高難易度とはどういうことなのか……。

日本百名山全体を見ても皇海山は割と(体力的に)難易度の高い方なのではないかと思う。コースタイムが10時間以上なのは他に平ヶ岳(コースタイムが12時間で、山中に宿泊できない)が思いつく。

続きを読む

ClutTeXについての計画

LaTeX処理自動化ツールClutTeXの今後の計画について。

まず、いくつかバグ修正や機能追加が溜まっているのでバージョン0.6をリリースしたいです。

それで、TeX LiveのContributing package

を久しぶりに読んだら「manページを書いた方が良い」「tarball中にバージョンがわかるファイルがあると良い」みたいな文言があった(以前読んだ時に読み飛ばしたのか最近新しく追加されたのかは未確認)ので、manページを書こうとしています。

manページは他のフォーマットから(pandocなどで)変換することもできるようです(llmkを見たらronnというツールでMarkdownから変換しているようです)が、ツールへの依存を増やしたくないので、書き方を勉強して手書きしようとしています。具体的にはmdocという記法で、

というページを参考にしています。

それ(v0.6リリース)が終わったら、Luaで書かれたコードをStandard MLに移行したいです。LunarMLを作ってきた目的の一つです。ソースコードはStandard MLで書いても、配布は従来通りLuaスクリプトとして行えるようにします。

ところで、静的型言語からLuaに変換する系のやつを改めて調べると

みたいなやつが増えていました(2020年ごろはなかった or 知名度が低かったと思います)。まあLunarMLを作ってしまったのでLunarMLでやります。

こっちの作業もブランチを切って少しずつ進めています。

コンパイルに使うLunarMLはまだリリースしていない状態で、他人が使うには難があるので、ClutTeXのSML版を出す前にLunarMLのバージョン0.1をリリースしたいです。ただし、ClutTeXのSML版が書ける程度に標準ライブラリーを充実させたいです。

SMLへの移行が終わったら、本格的なバグ修正や機能追加に移ります。バグ修正としては、BibTeXの .bib ファイルを更新した際に再処理を行うようにしたいです(Biberに関しては最近プルリクがあって実装して頂きました)。

機能追加としては、ユーザーごとの(プロジェクトに依存しない)設定ファイルを実装したいです。設定項目はターミナルの色付けや、終了時のアクション(「PDFビューワーで開く」などのコマンドを実行できるようにする)を登録できるようにしたいです。フォーマットはTOMLを考えています(なので、TOMLパーサーを書かなくてはいけない)。

まとめると、以下の順序と時期で進めていきたいです。

  1. ClutTeX v0.6リリース:11月中、遅くとも年内
  2. ClutTeXをStandard MLで書き直したものがある程度動くようにする
  3. LunarML v0.1リリース:できれば11月中、遅くとも年内
  4. Standard MLで書き直されたClutTeXをリリース(v0.7?):時期未定

やりたいことリスト(2023年10月)

数ヶ月前にやりたいことリストという記事を書きましたが、相変わらず(?)やりたいことに対して時間が少なく感じます。

プログラミング

LunarML

そろそろv0.1をリリースしたいです。記事も準備しています。

ただ、ClutTeXで必要な最低限の機能は揃えてからリリースしたい気もします。直近ではClutTeXで欲しくなったので BinIOString.isSubstring を実装しました。

10月中にリリースできなくても、11月にはリリースするようにしたいです。

ClutTeX

BibTeX関連で具体的な修正箇所が判明したので直しています。

直したらリリースするべきですが、GitHubの方に来ているPRを先にマージした方が良いのか悩んでいます。まあこまめにリリースすればいいんですけど。

Standard MLへの書き換えも気が向いた時に進めていて、手足となるモジュールは大体移植した(あるいはLuaコードのラッパーをSMLで書いた)と思います。あとは一番大事なメイン部分です。

Haskell関連

SIMD周りの作業は休止中です。

32ビットArm向けのクロスコンパイラーをビルドしようとして遭遇した問題を(原因をある程度特定した上で)バグ報告したりしました。

執筆物

書きたい記事はいくつかあります。

  • 新しくプログラミング言語を作るとしたら文法をどうするか
  • 型クラスとインターフェースの比較
  • x86のVEX/EVEXプリフィックスとAPXについて

勉強したいこと

Handbook of Constructive Mathematicsは気になった章をつまみ食い的に読んでいます。

それで、構成的数学のモデル(?)みたいなものをもっとちゃんと勉強するべきだと思って、SGLを読んでみようかと思っています。しかしどうやって時間を捻出するかが問題です。

アウトドア

10月に入ってから安達太良山に行きましたが、若干物足りなかったので、もう少し秋山に行きたいです。しかし泊まりで行くと大掛かりになるので、近場で済ませるかもしれません。

欲しいもの

ミラーレス一眼が欲しいけど先送りにするのは前の記事に書きました。当面は一眼レフを使い続けます。

ただ、一眼レフで使っているレンズが、保管環境の管理をサボっていた時期があったせいか、像が微妙な感じになっている気がします。なので新しいレンズを入手したいのですが、一眼レフの全盛期が過去のものになったせいか、レンズのラインナップが以前と比べて減っている気がします。どうしたものか。

どっちみち今年は色々大きな出費があった(iPhone、登山靴、ミニPC)ので、出費を躊躇しています。

時間とお金の捻出

前の記事で言及したGitHub Sponsorsを始めてみましたが、まだ勝手がよくわかりません。まあどっちみちあまり期待はしていないのですが。


この記事は20分で書きました。