「LunarML」タグアーカイブ

関数に色をつけるべきか：LunarMLの場合

function coloring problem（関数色付け問題）という概念がある。知らない人のために説明すると、こういうことだ：

とあるプログラミング言語では、関数に色がついている。どの関数も、「青」か「赤」のいずれかの色を持つ。関数呼び出し構文にも色がついている。青い関数の呼び出し元の色はどちらでも良いが、赤い関数は赤い関数からしか呼び出せない。赤い関数の呼び出しには何らかの煩雑さが伴う。いくつかの重要な関数は赤い。

このような言語では、例えば map のような高階関数は色ごとに2通り書く必要があるだろう：

red_function red_map(f: a -(red)-> b, array: a[]): b[]
{
    let result = [];
    for (let i = 0; i < array.length; ++i) {
        result.push(f(array[i])red);
    }
    return result;
}
blue_function blue_map(f: a -(blue)-> b, array: a[]): b[]
{
    let result = [];
    for (let i = 0; i < array.length; ++i) {
        result.push(f(array[i])blue);
    }
    return result;
}

（この言い回しの初出はこの記事と思われる：「What Color is Your Function? – journal.stuffwithstuff.com」）

この概念を初めて聞いた人は、「そんな面倒くさい概念のある言語は実用的ではない」と思うかもしれない。しかし、勘の鋭い人はピンとくるだろう：「通常の関数とasync関数のことか」、と。

非同期処理を書きやすくするためにいくつかの言語に導入されているasync関数では、async関数を呼び出して結果を利用するには呼び出し元もasyncである必要がある。

この記事では、私が開発しているLunarMLという言語処理系で関数色付け問題をどう扱うかを検討する。

続きを読む →

LunarMLの進捗2025

LunarMLの今年の進捗を振り返ります。昨年の振り返り記事と、今年のLunarML関連記事は以下の通りです：

LunarMLの進捗2024（去年）
never型があると便利か（言語処理系実装者の観点から）（3月）
LunarMLとJavaScriptの連携について（7月）
良いコンパイラーは親切なエラーメッセージを出さなければならない：LunarMLの場合（7月）
LunarMLの近況／中間言語に型をつける（8月）
ML Family WorkshopでLunarMLについて発表した（11月）
LunarMLでのUnicode文字列の扱い／文字列型はいくつ用意すれば十分か（12月）

続きを読む →

LunarMLでのUnicode文字列の扱い／文字列型はいくつ用意すれば十分か

先日、「新しくプログラミング言語を作る際に文字列型をどうするべきか」という記事に私の文字列型についての持論を書きました。

この記事では、私が作っているLunarMLというStandard ML処理系で文字列をどう扱っているか（あるいは、どう扱う予定であるか）を紹介します。

続きを読む →

ML Family WorkshopでLunarMLについて発表した

海外デビュー

特定の技術について関心を持った人が集まって交流する会が開かれることがあります。関数型言語で言うと、今年の6月に「関数型まつり」という国内イベントが開かれました。もっとStandard MLにフォーカスした集まり、あるいは、国際的な集まりとなると、ML Family Workshopがあります。

ML Family Workshopは、関数型プログラミングに関する国際会議であるICFP (International Conference on Functional Programming) に付属して開催されるワークショップで、その名の通りStandard MLに限らず、ML系と呼ばれるプログラミング言語群（OCaml, F#等）も対象としています。きっちりした査読等はなく、比較的ゆるい感じのようです。

ICFPは今回はSPLASH (International Conference on Systems, Programming, Languages and Applications: Software for Humanity) という会議と合同で開催され、全体では1週間ほどあります。ML Family Workshopは10月16日の1日の開催で、私もその日だけの参加としました。

（OCamlについてはOCaml Users and Developers Workshopというイベントもあり、これもICFPと併設です。日付が重ならないように（隣になるように）配慮されているほか、（おそらくOCamlの方が人気なので）OCamlの枠に収まらなかった発表がML Familyの方に回されることもあるようです。）

LunarMLの開発を何年も続けていて、スター数もそこそこあるので目に留まりやすくなったのか、今年の前半に「今年のML Family Workshopで発表しないか」というお誘いをいただきました。ICFPは毎回開催場所が異なり、今年は10月にシンガポールでの開催でした。

続きを読む →

LunarMLの近況／中間言語に型をつける

私が作っているStandard MLコンパイラー、LunarMLの近況報告記事です。LunarMLに関する直近の記事は

でした。

400スター

GitHubスター数が400に到達しました。ありがとうございます（執筆時点では402に増えています）。まだスターをつけていない方は https://github.com/minoki/LunarML でスターをつけることができます。

スターが350に到達したのは2024年10月、300に到達したのは2024年5月のことだったようです。

（本プロジェクト限定というわけではありませんが）GitHub Sponsorsにも触れておくと、現在は @toyboot4e さんと @kevin-kmetz さんにスポンサーしていただいています。ありがとうございます。

https://github.com/sponsors/minoki

中間言語に型をつけたい：型をつける動機付け

JavaScript連携の記事で、

JavaScriptの Promise の then はコールバックが Promise（正確にはThenable）を返したら更にそれを待ち受ける挙動をします。モナドのbindみたいな感じです。この仕様があると ('a promise) promise みたいな型をいい感じに扱えないので、Standard MLの世界のコードが Promise の中身として Promise を返そうとした場合はラッパーを噛ませるようにします。

と書きました。「Promise の中身として Promise （より正確には Thenable）を返そうとした場合はラッパーを噛ませる」の部分をコードで説明すると、次のような関数 wrapThenable, unwrapThenable の呼び出しを適宜噛ませる形になります：

function ThenableWrapper(x) {
    this.payload = x;
}
function wrapThenable(x) {
    if (typeof x === "object" && typeof x.then !== "undefined") {
        return new ThenableWrapper(x);
    } else {
        return x;
    }
}
function unwrapThenable(x) {
    if (x instanceof ThenableWrapper) {
        return x.payload;
    } else {
        return x;
    }
}

JavaScriptの通常の Promise との相互運用を可能にするため、値が Thenable ではない場合は元の値を活用します。

しかし、Promise の操作をするたびに必ず wrapThenable の呼び出しを挟むというのはダサいです。値の型が string や int など、明らかに Thenable ではないことがわかっている場合は、呼び出しを省略したいです。そのためには、最適化が進んだ段階でもコードの型情報を保持しておくことが必要です（インライン化によって型が判明する状況を考慮する）。現状のLunarMLでは最適化はCPS中間言語に対して行っているので、CPS中間言語を型付きにすることが必要です。

型情報の別の用例を挙げます。次のコードを考えます：

(* val foo : unit -> unit
   val bar : unit -> string *)
val x : unit = foo ()
val _ = bar x

x は unit 型の変数で、情報を保持していません。こんなコードを書く人はいないと思われるかもしれませんが、最適化の結果としてこういうコードが現れることは十分にあり得ます。

この場合、ソース中の x という変数を出力コードに反映させるのは無駄です。特に、Luaではローカル変数は貴重な資源なので、節約したいです。そこで、「型が unit の変数の使用は値 () で置き換える」という変換が考えられます。

そんな感じで、中間言語、特にCPS中間言語に型がついていると便利そうです。

中間言語に型をつけたい：作業

LunarMLの中間言語は

ソース（Standard ML）→（いくつかの前処理と型検査）
→型付き中間言語→（モジュールの脱糖、オーバーロードとequality typeの脱糖）
→System Fωライクな中間言語→（パターンマッチの脱糖）
→System Fωライクな中間言語→（CPS変換）
→CPS中間言語→（各種最適化）
→CPS中間言語→（ネストされた式の回復）
→ネストした式のある中間言語→（変換）
→LuaやJavaScriptのコード→（変換）
→最終的なLuaやJavaScriptのコード

という流れになっています。

従来は、System Fωライクな中間言語までは型がついていて、CPS中間言語には型がないという状況でした。3月ごろに、System Fωライクな中間言語の型検査器を実装しました。

今回、CPS中間言語を型付きにして、型検査器も実装しました。

型付きのCPS変換はしっくりくる先行研究が少なくて、なかなか難航しました。LunarMLの型付きCPSメモにいくつかメモりましたが。

最終的には、「型抽象と型適用は、通常の関数と関数適用と同様に扱う（ただしフラグをつけて区別できるようにする）」「最適化をある程度かけた段階で、多相型を消去する。完全に型を消去するのではなく、漸進的型付けのAnyのような感じで置き換える。その後再び最適化をかける」という形にしました。

最初は中間言語に対する型検査器はなくても良いかなと思っていましたが、型に関するバグがあったときに型検査器がないとエスパーでデバッグする羽目になり、しんどかったです。なので、結局型検査器を実装しました。実装したらしたで無限にバグが見つかってしんどいことになりましたが。

型周りのバグの発見には、過去に書いたテストが役に立ちました。テストは資産です。

悪いニュースとして、CPS中間言語に型をつけたことで、コンパイルが遅くなったり、メモリ使用量が増大したりしています。中間言語の型検査をやめれば時間の増加は軽減されると思いますが、テスト時はしっかり検査したいので、テストの所要時間は減らせなさそうです。

ML Family Workshop

今年のICFPはシンガポールでの開催で、それと併設で10月16日にML Family Workshopというのが開催されます。学会誌なんかは出ない、インフォーマルな集まりのようです。

このML Family WorkshopにLunarMLの話を応募したところ、通りました。というわけで、行ってきます。

このところLunarMLの作業を頑張っているのは、ML Family Workshopで話せる内容を少しでも増やしたいという気持ちからです。ですがCPS中間言語の型付けに時間を使いすぎた感があるので、そろそろ資料作成と発表練習をしないといけません。

バージョン0.3.0

ML Family Workshopの前になるか後になるかは不明ですが、そろそろ新しいバージョンとしてリリースしても良いかもしれないと思っています。ユーザー視点ではJavaScript周り（Promise連携とか）が新機能になるかと思います。GitHub Actionsでビルドする仕組みを整えたので、MLtonでビルドしたバイナリーも配布できると思います。

良いコンパイラーは親切なエラーメッセージを出さなければならない：LunarMLの場合

プログラミング言語の静的解析の良い点として、一回の解析で複数の誤りを検出できる（場合がある）点があります。実行時エラーしか出ない言語だったら、一回の実行で一個のエラーに遭遇して、修正して、またエラーに遭遇して、ということを繰り返さなければなりません。

言い換えると、遭遇した最初の誤りでコンパイルが停止してしまうようなコンパイラーは、いくら静的な型システムを備えていても、動的言語並みの貧弱な開発体験しか得られないということです。コンパイルの手間がかかる分むしろマイナスです。

コンパイラーではなく言語サーバーでも同じことで、ソースコードの最初の誤りで解析が停止してしまう言語サーバーからは貧弱な開発体験しか得られないでしょう。

検出できるエラーの個数だけではなく、エラーメッセージの親切さも、結構開発体験を左右するのではないかと思います。よくある誤りに対して的確なエラーメッセージを出すことができれば、ユーザーがエラーの原因で悩む手間が省けます。

一つの言語仕様に対して複数のコンパイラーが存在する状況で、エラーメッセージの品質はコンパイラー間での差別化の要素になり得ます。この記事では、Standard MLコードに対して良いエラーメッセージを出す工夫について考えてみます。

続きを読む →

LunarMLとJavaScriptの連携について

久しぶりにLunarMLの話題です。LunarMLは、私が作っているStandard MLコンパイラーです。

最近は、JavaScriptとの連携に関する機能を追加しています。Webで使えるようにするのと、Promise/async/await周りの統合をいい感じにすることを目標にしています。

続きを読む →

never型があると便利か（言語処理系実装者の観点から）

TypeScriptをはじめとするいくつかのプログラミング言語には、never型という型がある。この型は典型的には「制御を返さない関数」の返り値として使われる：

function f(x: string): never {
    console.error(x);
    throw new Error();
}

never型は型システム的には「値を持たない型」「任意の型の部分型」として特徴づけられる。

他のプログラミング言語、例えば私が作っているLunarMLにもnever型があると便利だろうか？

続きを読む →

LunarMLの進捗2024

LunarMLの今年の進捗を振り返ります。この記事は言語実装 – Qiita Advent Calendar 2024の14日目の記事です。

続きを読む →

LunarMLと文字列フォーマット

LunarMLをLuaの代替として使う際、Luaの機能を自然に使えると良さそうです。例えば、文字列フォーマット関数 string.format を呼び出す際には現状では引数の型キャストが必要ですが、フォーマット文字列にいい感じの型をつければキャストが不要になるのではないでしょうか。

ML系言語の仲間であるOCamlには、フォーマット文字列が期待される文脈で特別な型付けを行う機能があります。LunarMLでも似たようなことをするといいのではないか、というわけで検討します（検討するだけならタダなので）。

続きを読む →

雑記帳

人生やっていき

「LunarML」タグアーカイブ

関数に色をつけるべきか：LunarMLの場合

LunarMLの進捗2025

LunarMLでのUnicode文字列の扱い／文字列型はいくつ用意すれば十分か

ML Family WorkshopでLunarMLについて発表した

海外デビュー

LunarMLの近況／中間言語に型をつける

400スター

中間言語に型をつけたい：型をつける動機付け

中間言語に型をつけたい：作業

ML Family Workshop

バージョン0.3.0

良いコンパイラーは親切なエラーメッセージを出さなければならない：LunarMLの場合

LunarMLとJavaScriptの連携について

never型があると便利か（言語処理系実装者の観点から）

LunarMLの進捗2024

LunarMLと文字列フォーマット