- プログラミング
.NETグラフライブラリ QuickGraphを使う
.NETグラフライブラリ QuickGraphを使う
本エントリはC# Advent Calendar 2013 9日目のエントリです。
自己紹介ですが、デンソーアイティーラボラトリというところで研究開発をやっております。スコープは車とかITSとかそれにまつわるソフトウェア全般です。
研究のためのソフトウェア環境としては珍しくC#を使っておりますが、JavaやPythonよりもそういったリソースが少ないながら、質の高いライブラリが多いというのが実感です。今回はその中からQuickGraphという便利なライブラリの紹介です。かなり以前からCodePlexで公開されているので利用されている方も多いと思いますが、簡単に使えるように解説します。
QuickGraphとは、グラフ型のデータ構造や各種アルゴリズムを備えた、.NET用のライブラリです。CodePlexのプロジェクトとして、2003年12月から公開されていました。
グラフ解析の用途としては、我々が扱っているようなナビゲーションに関するものや、配管や工場のライン、送電網などのネットワークを扱った最大フローを求めるような問題、スケジューリングなどになります。ソーシャルネットワークの解析などでグラフマイニングを用いられる事が多いため、この応用事例が目立ちます。
5、6年前にこの手のライブラリを探していた当時はJavaが多く、オープンソースのJUNG や商用でビジュアライズの充実した yFilesなどが有名でした。現在はPythonのライブラリが充実しているようですね。
MatlabやRなど数値処理系の開発環境を使ってグラフアルゴリズムを扱うと好都合なことも多いと思いますが、特殊なVisitorパターンを用いたアルゴリズムを開発しようとすると、オブジェクト参照を基盤としていない、これらの言語では直観的でないプログラミングになりがちです。そういう時はC#,Javaなどの言語の方が分かりやすいですし、デバッグなどもし易いと思います。
実はC#に拘るのは少し別の理由だったりしますが、とにかくC#でグラフデータを扱いたいという動機で探してこのライブラリを見つけました。
いくつか利点があります。
C#erとしては経験の浅い私には当初とっつきにくかったのですが、徐々にその良さがわかってきたというところです。
QuickGraphのCodePlexのページの解説は貧弱で、なかなかとっつきにくいので、各種のシナリオに沿って紹介するのをこの記事の目的とさせていただきます。
nuget : QuickGraph から最新版の取得ができます。
.NET,Silverlight, Windows Phone, Windows Storeアプリで活用できます。
グラフ理論のベーシックなところは、たくさんの良い解説があると思うので省かせて頂きますが、QuickGraphで扱う概念のリストを書いておきます。
お決まりになりますが、Edge(辺)はインターフェイスIEdge、Vertex(頂点)は型TVertexで定義されます。(有向グラフの場合)
TVertexは既存のクラスであれば何でも良いわけで、特にQuickGraph用に特別なプロパティやメソッドを用意する必要はありません。何かを実装、継承する必要すらありません。
IEdgeはインターフェイスですが、必要なpublic要素は以上で全てです。最小の定義はこれだけです。これが利点1,2に貢献しています。
また、アルゴリズムは以下の形式となり、任意のTVertex,IEdgeを対象にできる柔軟性の高い記述が可能です。大ざっぱに言うとCollectionの処理と同様の使い方ということですね。
グラフをビルドするのは簡単です。
SEdgeというのはIEdgeを単純に実装しただけのクラスです。TVertexとしてintを利用しているので頂点の生成コードはいりません。
頂点は辺に内包されておりますので、グラフはSEdgeのコレクションで表現できます。ここでは配列になっています。
残念ながらこのままでは直接アルゴリズムを利用できません。以下のように隣接行列をビルドしAdjacencyGraphを生成する必要があります。
QuickGraphのソースを追ってみると、中で行われている本質的な処理はAdjacencyGraphクラスのコンストラクタの以下の部分だけです。(かなり要約していますが)
頂点から出ていく辺のディクショナリーの生成をしているだけで、隣接行列を作ったり、この段階では、特殊な処理を行っているわけではありません。
ほかにもいくつものグラフの生成方法がありますのでQuickGraphのドキュメントを参照ください。
これも特に説明するまでもありません。VerticesメンバはIEnumerableなのでコレクションとしてイテレートできます。
また頂点から出る辺を辿るにはこうです:
このように当たり前の事は直感的にできるようになっています。
もう少し複雑なイテレートをやろうとした場合は、そのためのアルゴリズムが用意されています。幅優先探索を例にすると以下のようなステップになります。
グラフgと始点targetが与えられます。BreadthFirstSearchAlgorithmというまんまの名前のクラスがあるのでgで生成します。
predecessorsはただのエッジのリストです。これをオブザーバとしてTreeEdgeメンバへEdgeActionという形でリスンさせます。
Computeとすると、targetから幅優先探索が行われ、predecessorsに順に辺が格納されていきます。
そして順序づけられたpredecessorsに対して何か処理を行うことができます。
イテレートする際に行う処理をデリゲートで渡すことができるため、ノードだけ収集したい場合など柔軟に対応できます。
目的地までの最短経路を求める問題は、ダイクストラ法がよく知られていますが、QuickGraphではこれもまんまの名前で、DijkstraShortestPathAlgorithmというクラスがあります。
このクラスをまずグラフとコストを示すデリゲートにて生成します。コストは関数で記述できるのでエッジの状態から都度再計算するような事もできます。
次にVertexPredecessorRecorderObserverというオブザーバークラスにdijkstraにアタッチします。
(オブザーバーが無いと後で最短パスを取ることができません。)
Computeで探索を行い、結果がオブザーバーにセットされますから、これをtargetを指定して取り出します。
Computeの段階で最小スパニング木が求められ、TryGetPathの段階で指定されたターゲットへの最短経路が求められるわけです。
Observerパターンにより、辺の列を取るだけでよいばあい、各辺までの距離を求める場合、など必要な処理のみを行わせることができるので、利点3に貢献します。
頂点が2次元空間上の点に当てはめるとすると以下のような頂点クラスを定義します。
すると、必然的に上記のラムダ式は以下のように置き換えることができます。
このような形で、A*アルゴリズムによる最短経路探索、Floyd Warshall法による全点間の最短経路探索、最小スパニング木、最大フロー問題、強連結成分など、アルゴリズムの教科書に出てきたような問題はほぼ解くことができます。
このように柔軟性が高いライブラリですので、様々な用途で使うことができると思います。またグラフ解析そのものの研究などを行うことも可能で、独自のアルゴリズムをこの枠組みで作れば、非常に効率が良い研究ができるのではないでしょうか?