練習問題
ここにあげられた練習問題を解くときには ――さらに言えば動的計画法を使うアルゴリズムを新しく作るときにはどんなときでも――、 以前に示したステップを踏むことを強く勧めます。特に、準備が完了するまでは表や for ループについて考え始めないでください。ここで言う準備とは、実際に解くことになる再帰的な小問題の英語で書かれた明解な仕様と、それを使った元の問題に対する完全な解のことです1。 まず動くようにせよ。それから速くせよ。
列/配列
-
あなたの前世は南極大陸植民地 Nadiria 州で働くレジ係で、一日の大半を客にお釣りを渡す仕事に費やしていました2。南極では紙がとても貴重で高価なので、レジ係がお釣りを渡すときにはなるべく少ない紙幣を使わなければならないと法律で定められていました。植民地の創立者の一人が数秘術的な嗜好を持っていたおかげで、夢ドル (dream dollar) と呼ばれる Nadira で流通する紙幣は $1, $4, $7, $13, $28, $52, $91, $365 という金額です。
-
♠ この問題に対する貪欲なアルゴリズムは、残りのお釣りの金額を超えない最大の紙幣を返していくというものです。例えば、 $122 に対して貪欲なアルゴリズムを適用すると、$91, $28, $1 とお釣りを渡すことになります。この貪欲なアルゴリズムを使うと理想的な枚数よりも多くの夢ドル紙幣を渡してしまう例を示してください。 [ヒント: 手で解くよりもプログラムを書いた方が早いかもしれません。]
-
整数 が与えられたときに、 夢ドルのお釣りを返すのに必要となる最小の紙幣の枚数を返す再帰的なアルゴリズムを説明してください (アルゴリズムの実行速度は気にしないでください: まずは正しくしてください)。
-
整数 が与えられたときに、 夢ドルのお釣りを返すのに必要となる最小の紙幣の枚数を返す動的計画法のアルゴリズムを説明してください (ここでは、アルゴリズムが高速であることが求められます)。
-
-
次にあげる文字列分割問題の変種を解く効率の良いアルゴリズムを説明してください。文字列を受けとってそれが "単語" である場合に限って を返すサブルーチン が使えると仮定し、アルゴリズムの解析では の呼び出し回数の上限を求めてください。
-
文字列 が与えられたときに、 を単語の並びに分割する方法の数を求める。例えば、 という文字列は と に分割できるので、アルゴリズムはこの文字列に対して を返す。
-
二つの文字列 と が与えられたときに、同じ添え字を使って と を単語の列に分割できるかどうかを判定する。例えば と は次のように同じ添え字を使って単語の列に分割できるので、アルゴリズムは を返す。
-
二つの文字列 と が与えられたときに、同じ添え字を使って と 両方を単語の列に分割する方法の数を計算する。
-
-
配列 が与えられたとします。 の要素は正、負、またはゼロの数であり、整数であるとは限りません。
-
連続する部分列 の和の最大値を求めるアルゴリズムを説明、解析してください。
-
連続する部分列 の積の最大値を求めるアルゴリズムを説明、解析してください。
例えば入力として配列 が与えられたとき、一つ目の問題に対するアルゴリズムは 19 を返し、二つ目の問題に対するアルゴリズムは 504 を返します。
また、入力として一つの要素からなる配列 が与えられたとき、一つ目の問題に対する答えのアルゴリズムは を返し、二つ目の問題に対する答えのアルゴリズムは を返します (空配列も部分列です!)。解析においては比較、加算、乗算演算の実行時間が であると仮定して構いません。
[ヒント: (a) は少なくとも 1980 年代中頃から使われている標準的な情報科学の面接試験の問題です。ウェブには回答がたくさん載っていますし、この問題に対する Wikipedia のページだってあります!しかし 2016 年時点では、ウェブで見つかる (b) に対する答えの大部分が、実行時間が最良のものより遅かったり、そもそも正しい答えを計算していなかったりします。]
-
-
この問題では前問の最大部分列問題の変種を考えます。全ての問題で入力は任意の実数の配列 であり、いくつかの問題では も入力に含まれます。
-
回り込み: が環状 (circular) 配列だとします。この設定では "連続する部分列" が および を意味します。 の連続する部分列の和の最大値を求めるアルゴリズムを説明、解析してください。
-
長い部分列だけ: 長さが 以上の連続する部分列 の和の最大値を求めるアルゴリズムを説明、解析してください。
-
短い部分列だけ: 長さが 以下の連続する部分列 の和の最大値を求めるアルゴリズムを説明、解析してください。
-
ザ・プライス・イズ・ライト: 和が 以下の連続する部分列 の和の最大値を求めるアルゴリズムを説明、解析してください。
-
の要素が非負であると仮定したときに、前問のアルゴリズムを高速化してください。
-
-
この問題では様々な種類の最適な部分列を見つける効率の良いアルゴリズムを作ってもらいます。部分列とは列からいくつかの要素を削除し、残った要素の順序を保ったまま並べたときに得られる列のことです。部分列の要素は元の列で連続している必要はありません。例えば , , , はみな の部分列です。
[ヒント: 貪欲なアルゴリズムを使って 時間で解ける問題は一つだけです。]
-
と を任意の配列とします。 と の共通部分列 (common subsequence) とは、 の部分列でもあり の部分列でもあるような配列を言います。 と の最長共通部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
と を任意の配列とします。 と の共通超配列 (common supersequence) とは、 と の両方を部分列として含む配列のことを言います。 と の最短共通超配列の長さを計算する効率の良いアルゴリズムを説明してください。
-
配列 がバイトニック (bitonic) であるとは、ある添え字 が存在して、接頭部分 が増加列で接尾部分 が減少列となること言います。与えられた整数の配列 の最長バイトニック部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
配列 が振動している (oscillating) とは、全ての偶数 について であり、全ての奇数 について であることを言います。与えられた整数の配列 の最長振動部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
与えられた整数の配列 の最短振動超配列の長さを計算する効率の良いアルゴリズムを説明してください。
-
配列 が凸 (convex) であるとは、全ての について が成り立つことを言います。与えられた整数の配列 の最長凸部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
が弱増加 (weakly increasing) であるとは、全ての要素が前二つの要素の平均よりも大きい、つまり全ての について であることを言います。与えられた整数の配列 の最長弱増加部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
が二重増加 (double increasing) であるとは、全ての に対して が成り立つことを言います (言い換えれば、二重増加な配列とは二つの増加列を互い違いに並べたものです)。与えられた整数の配列 の最長二重増加部分列の長さを計算する効率の良いアルゴリズムを説明してください。
-
が増加 (increasing) 列であるとは、全ての について であることを言いました。二つの整数配列が与えられたときに、最長共通増加部分列を計算する効率の良いアルゴリズムを説明してください。例えば と の最長共通増加部分列は です。
-
-
二つの文字列 のシャッフル (shuffle) とは、それぞれの文字を順番を保ったまま一つの文字列に合成したものを言います。例えば は と のシャッフルであり、考えられる組み合わせ方は何種類かあります: 同様に、 と はどちらも と のシャッフルです:
-
三つの文字列 が与えられたときに、 が と のシャッフルであるかどうかを判定するアルゴリズムを説明、解析してください。
-
と の滑らか (smooth) なシャッフルとは、両方の文字列について文字が三つ以上連続して使われることがないシャッフルのことを言います。例えば:
- は と の滑らかなシャッフルです。
- は と の滑らかなシャッフルではありません (三文字以上が連続した文字列 と があるからです)。
- は と の滑らかなシャッフルです。
- と の滑らかなシャッフルは存在しません。
三つの文字列 が与えられたときに、 が と の滑らかなシャッフルであるかどうかを判定するアルゴリズムを説明、解析してください。
-
-
この問題では入力を () とします。
-
が の部分列であるかを判定するアルゴリズムを説明、解析してください。例えば文字列 は文字列 の部分列です。
-
から要素を取り除いて を の部分列でなくなるようにするとき、取り除かなくてはならない最小の要素数を求めるアルゴリズムを説明、解析してください。同じことですが、 の超配列でない の部分列のうち最長のものを求めるアルゴリズムを考えても良いです。例えば から を取り除いた文字列は を部分列として持ちません。
-
❤ の互いに重ならない二つの部分列の両方に が含まれることがあるかを判定するアルゴリズムを説明、解析してください。例えば は の二つの互いに重ならない部分列に含まれます。
-
追加の入力として実数の配列 が与えられ、 が のコストを表すとします。 の部分列 のうちコストが最小のものを計算するアルゴリズムを説明、解析してください。つまり、全ての に対して かつ となるような のうち、コスト が最小になるものを求めるアルゴリズムです。
-
の部分列に がいくつあるか計算するアルゴリズムを説明、解析してください。カウントする部分列どうしは重なっていても構いません。解析をするときには任意の桁の二つの整数の足し算が 時間でできると仮定して構いません。例えば は の中にちょうど 23 個あります。また と の文字が全て同じ場合、答えは です。
-
桁の数の加算演算が 時間かかるとして、(e) のアルゴリズムの実行時間を求めてください。
-
-
入力された文字列 の連続する部分文字列で、逆順にしたものもまた の連続する部分文字列であるもののうち最長なものの長さを求める効率の良いアルゴリズムを説明、解析してください。正順と逆順の文字列は重なってはいけません。例えば:
-
入力が の場合、答えは です。
-
入力が の場合、条件を満たす部分文字列 があるので、 答えは です。
-
入力が の場合、条件を満たす部分文字列 があるので、答えは です。答えとなる部分文字列とその逆順は重なってはいけないことに注意してください。
-
入力が の場合、条件を満たす部分文字列 があるので、答えは です。文字列 は連続していないので条件を満たしません。
-
-
回文 (palindrome) とは左から読んでも右から読んでも同じになる文字列のことを言います。例えば , , , は全て回文です。
-
与えられた文字列の最長回文部分列の長さを求める効率の良いアルゴリズムを説明、解析してください。例えば文字列 の最長回文部分列は なので、アルゴリズムの答は です。
-
与えられた文字列の最短回文超配列の長さを求める効率の良いアルゴリズムを説明、解析してください。例えば の最短回文超配列は なので、アルゴリズムの答は です。
-
任意の文字列は回文の列に分解できます。例えば文字列 ("Bubba sees a banana") は次のように分解できます (分解の仕方はこの他に 通りあります): 与えられた文字列を回文に分解するときに、最低でも必要となる回文の数を計算する効率の良いアルゴリズムを説明、解析してください。例えば に対するアルゴリズムの答えは です。
-
与えられた文字列をなるべく長い回文を使って分解するときに、使うことになる最短の回文の長さの最大値を求める効率の良いアルゴリズムを説明、解析してください。例えば:
-
入力 に対する出力は です。
-
入力 に対する出力は、 に対応する です。
-
同じ文字が 個並んだ文字列に対する出力は です。
-
-
与えられた文字列を回文に分解する方法が何通りあるかを計算する効率の良いアルゴリズムを説明、解析してください。例えば:
-
入力 に対する出力は です。
-
入力 に対する出力は です。
-
同じ文字が 個並んだ文字列に対する出力は です。
-
-
❤ ある文字列に対するメタ回文 (metapalindrome) とは、その文字列の回文への分解であって、分解した回文の長さからなる列も回文になっているものを言います。例えば はメタ回文です。なぜなら の回文への分解であり、回文の長さからなる列 が回文だからです。与えられた文字列に対する最短のメタ回文の長さを求める効率の良いアルゴリズムを説明、解析してください。例えば入力 に対するアルゴリズムの出力は です。
-
-
正の整数の配列 が与えられたとします。 の前後増加部分列 (increasing back-and-forth subsequence) とは、添え字の配列 であって次の条件を満たすものを言います:
- 任意の について
- 任意の について
- が偶数ならば
- が奇数ならば
もう少し崩して言うと、次のようになります: 正の整数が入った 個の箱が一列に並んでいるとします。一つの箱を選び、それが奇数番目の箱なら今の箱より左にある箱のなかで今よりも大きい数の入ったものに移動し、偶数番目の箱なら今の箱より右にある箱のなかで今よりも大きい数の入ったものに移動します。この移動を繰り返したときの添え字の列が前後増加部分列です。
与えられた 要素の配列の最長前後増加部分列の長さを求める効率の良いアルゴリズムを説明、解析してください。例えば
という配列が入力されたとき、アルゴリズムは次の前後増加部分列に対応する を答えます:
-
一段落の英語の文章を紙上に (どうしてもと言うなら、コンピューターのスクリーン上に) 組版したいとします。段落には 個の単語が含まれ、 番目の単語の長さは だとします。この単語列を長さがちょうど の行に分割することが目標です。
段落がどのように行に分割されるかに応じて、単語間の空白の幅を調整しなければなりません。なぜなら段落は両端揃えである、つまり各行の右端の余白と段落の最初を除いた各行の左端の余白が揃っている必要があるからです。また同じ行にある単語の間には一単位以上の空白が必要です。
段落のレイアウトのあふれ (slop) を次のように定義します: 最後の行を除く各行について、その行に含まれる "追加の" 空白の数、つまり実際に含まれる空白の数からその行にある単語の間の数を引いたもの、の三乗を求め、その和を段落のレイアウトのあふれとします。式で書くと、 番目の単語から 番目の単語が含まれる行のあふれは と定義されます。あふれが最小となるように段落を印刷する動的計画法のアルゴリズムを説明してください。
-
あなたは 8 才の甥 Elmo と単純なゲームを遊ぶことになりました。このゲームはカードを一列に並べた状態から始まり、あなたと Elmo は順番に左端または右端からカードを取っていきます。カードがなくなった時点でゲームは終了で、持っているカードのポイントの和が大きい方が勝ちです。
Elmo はアルゴリズムの講義を取ったことがないので、常に選択できる二枚のカードのうち大きな方を選択するという、単純な貪欲戦術を使います。この問題の目標は可能な場合には必ず Elmo に勝利する戦略を見つけることです (子供をこんな風に負かすのは大人げないかもしれませんが、 Elmo は手を抜いた大人に勝たせてもらうのが大嫌いです) 。
-
あなたは貪欲な戦略を使うべきでないことを示してください。つまり、貪欲な戦略に従わなかった場合にのみ勝てるゲームがあることを示してください。
-
与えられたカードの初期状態について、Elmo を相手に勝負をしたときに集められる最高得点を計算するアルゴリズムを説明、解析してください。
-
♣ Elmo が 4 才のときに使っていた戦略はもっと単純で、両端のカードのどちらかを一様ランダムに選ぶというものでした。つまり、彼のターンが回ってきたときに二つのカードが残っているならば、左端のカードを の確率で、右端のカードを の確率で選ぶということです。与えられたカードの初期状態について、4 才の Elmo を相手に勝負したときに集められる得点の期待値の最大値を計算するアルゴリズムを説明してください。
-
5 年後、 13 才になった Elmo は格段に強い完璧なプレイヤーになりました。与えられたカードの初期状態について、完璧な相手と勝負したときに集められる最高得点を計算するアルゴリズムを説明、解析してください。
-
-
あなたの flippin' sweet なダンスのスキルを見せつけるときが迫ってきました!明日大きなダンス大会があり、あなたはその大会のために人生をかけて準備をしてきました (アラスカで伯父とクズリ狩りをしていた時間は除く)。あなたは 人の審査員それぞれがコンテストでかける 曲を時系列順に並べたリストを前もって手に入れることに成功しました。 Yesssssssssss!
あなたは全ての曲と審査員と自分のダンスの上手さについてとてもよく理解しているので、 任意の について 番目の曲を踊った場合の点数が であることを知っています。また 点を獲得するために 番目の曲を踊った場合、疲れてしまうので次の 曲では踊ることができません ( 番目の曲から 番目までの曲で踊れないということです)。合計点数が一番大きいダンサーがコンテストで優勝するので、あなたは合計点数はなるべく高くしたいと思っています。
取得できる最高得点を計算する効率の良いアルゴリズムを説明、解析してください。あなたの sweet なアルゴリズムに対する入力は配列の組 , です。
-
新作のスワップパズルゲーム Candy Swap Saga XIII には から までの数字がついた 匹のかわいい動物が出てきます。この動物達は circus peanuts, Heath bars, Cioccolateria Gardini chocolate truffles という三つのアメのうちどれか一つを持っています。あなたは最初 circus peanut を持っている状態でゲームが始まります。
あなたは動物を から まで順番に訪ね、動物とアメを交換することでポイントを獲得していきます:
-
自分の持っているアメと同じ種類のアメと交換したとき、ポイントを獲得する。
-
自分の持っているアメと違う種類のアメと交換したとき、ポイントを失う (ポイントは負になりうる)。
-
交換をしなかった場合、ポイントは変わらない。
あなたは 匹の動物を順番通りに訪れなくてはならず、一度訪れた動物を再び訪れることはできません。
獲得可能な最高得点を計算する効率の良いアルゴリズムを説明、解析してください。アルゴリズムに対する入力は であり、 が 番目の動物が持っているアメの種類を表します。
-
-
新設される Maksymilian R. Levchin 情報科学大学に学部長として着任することになっている Lenny Rutenbar は、 Orchard Donws そりゲレンデの南コースに3小さな雪のジャンプ台をいくつか作らせ、電子計算工学科の学科長 Bill Kudeki にそり対決を申し入れました。Bill と Lenny はコースをそりで滑り降り、滞空距離を競います。勝者は Siebel Center と新設の ECE 棟を学部/学科のものにできますが、敗者は学部/学科全体を Loomis Lab の隣にある Boneyard 排水渠に移動させなければなりません。
Lenny および Bill がジャンプ台に差し掛かったときに地上にいるなら、ジャンプ台を使ってジャンプをするか通り過ぎるかを選択できます。当然ジャンプ台は滞空時には使えないので、ジャンプをした場合には以降のジャンプ台をいくつか見逃す可能性があります。
-
配列の組 と が与えられ、 が頂上から 番目のジャンプ台までの距離を表し、 が 番目のジャンプ台でジャンプしたそりが滞空する距離を表すとします。Lenny または Bill の最大滞空距離を計算するアルゴリズムを説明、解析してください。
-
Lenny と Bill の小さな賭け事について耳にした大学の弁護士はこの対決について異議を唱えました。とどまることを知らない保険料率と訴訟から大学を守るために、弁護士は二人がジャンプできる回数に上限を設けました。前問の と に加えて が与えられ、ジャンプが最大 回しか許されていない場合に、Lenny または Bill の最大滞空距離を計算するアルゴリズムを説明、解析してください。
-
❤ ジャンプの回数に上限を設けても対決が取りやめにならなかったのを見て、弁護士はさらなる制限を加えました: どのジャンプ台も一度しか使われてはいけないというのです!法律の干渉にうんざりした Lenny と Bill は賭けを諦め、その代わり協力して観客が楽しめる滑りをすることを決めました。前問の設定に加えて二人が同じジャンプ台を使えないとしたときに、二人の滞空距離の和の最大値を求めるアルゴリズムを説明、解析してください。
-
-
農家の Boggis, Bunce, Bean は Mr. Fox のために障害物コースをこしらえました。コースは一列に並んだブースでできており、各ブースには明るい赤で番号が書いてあります。きちんと言うと、Mr. Fox には実数の配列 が与えられ、 が 個目のブースに書かれた番号を表します。 三人の農家と Mr. Fox は次のルールに従います:
-
Mr. Fox はブースに入るたびに "Ring!" と "Ding!" のどちらかを必ず言う。
-
番目のブースで "Ring!" と言った場合、 個のチキンを得る ( のときは 個のチキンを失う)。
-
番目のブースで "Ding!" と言った場合、 個のチキンを失う ( のときは 個のチキンを得る)。
-
Mr. Fox は四つのブース連続で同じ単語を言うことはできない。例えば 6, 7, 8 番目のブースで "Ring!" と言ったなら、9 番目のブースでは "Ding!" と言わなければならない。
-
獲得したチキンの清算は全てのブースを訪れ、審判が "Hot box!" と言った後に行われる。Mr. Fox は障害物コースをチキンをもって回る必要はない。
-
Mr. Fox がルールを破った場合、あるいは障害物コースを完走した時点で農家にチキンの貸しがある場合、農家は Mr. Fox を銃で撃つ。
与えられる配列 で表される障害物コースを走ったときに Mr. Fox が獲得できるチキンの数の最大値を計算するアルゴリズムを説明、解析してください。 [ヒント: 燃えた松ぼっくりに注意!]
-
-
ダンスダンスレボリューション (Dance Dance Revolution) は日本のゲーム会社コナミによって 1998 年に制作されたダンスゲームです。プレイヤーは上下左右の矢印が足元に書かれた舞台に立ち、ゲーム画面下から上に流れる矢印 () が画面の一番上に来た時にタイミングよくステップを踏むというゲームです (矢印は画面の一番上に来たときにちょうど曲の拍に合うように流れてきます)。
このゲームの変種 "Vogue Vogue Revolution" の目標は、動きを最小限にしつつ完璧にプレイすることです。矢印が画面の一番上に来たときに足が元々その矢印の上にあるなら、体を動かさずに済むことに対して スタイルポイントが与えられます。もし踏まなければならない矢印に両方の足が無い場合は、ちょうど一つの足をその矢印の場所に移動させます。間違った矢印に足を動かした場合、正しい矢印を踏めなかった場合、足が正しい位置にあるのに足を動かした場合にはスタイルポイントを全て失ってゲームオーバーとなります。
どうすればスタイルポイントを最大化できるでしょうか? この問題ではスタート時点で左足は に、右足は にあり、 プレイヤーは流れてくる矢印を完全に記憶しているとします。例えば に対しては、次のようなステップで スタイルポイントを獲得できます。
-
任意の 個の矢印の列に対して、 少なくとも スタイルポイントを獲得できることを示してください。
-
VVR の譜面に対して獲得可能な最大のスタイルポイントを計算する効率の良いアルゴリズムを説明してください。入力は矢印の向きの配列 です。
-
-
次の一人遊びのスクラブルを考えます。ゲームはアルファベットと数字が書かれたタイルの有限列をテーブルの上に置いた状態で始まり、ゲームの開始とともにプレイヤーはタイル列から最初の七つのタイルを手札に加えます。各ターンで、プレイヤーは手札のタイルの一部もしくは全部を使って英単語を作り、そのタイルに書かれている数字だけ点数を獲得します (手札から英単語を作れないならそこでゲーム終了です)。英単語を作った後は次の条件のいずれかが成り立つまでタイルをタイル列から手札に加えます (a) 手札が七枚になる (b) タイル列が空になる (ダブル/トリプルワードやビンゴ、ブランク、パスはありません)。目標はなるべく多くの得点を獲得することです。
例えば、次の 20 個のタイルからなるタイル列を考えます: このタイル列からゲームを開始した場合、次のようにすると 68 点を獲得できます。
- 手札が と初期化される。
- を出して 9 点を得る。手札には が残る。
- 次の 5 枚のタイル を手札に加える。
- を出して 15 点を得る。手札には が残る。
- 次の 5 枚のタイル を手札に加える。
- を出して 19 点を得る。手札には が残る。
- 次の三枚のタイル を手札に加える。
- を出して 16 点を得る。
- を出して 9 点を得る。手札が空になったのでゲーム終了。
このゲームについて、次の問題に答えてください。
-
タイル列が と で定義されるとします。ここで には から までの文字が格納され、 は文字 の点数を表します (この問題では同じ文字は全て同じ点数を持つとします)。与えられたタイル列における最高得点を計算する効率の良いアルゴリズムを説明、解析してください。
-
同じ文字でも異なる点数を持つことを許すことにします。このとき入力は と であり、 が 番目のタイルの点数を表します。与えられたタイル列における最高得点を計算する効率の良いアルゴリズムを説明、解析してください。
両方の問題において、アルゴリズムの出力は可能な最高得点を表す数字です。また手札にある七枚のタイルから作れる全ての英単語とその点数を 時間で計算できるとして構いません (実際できるので)。
-
平面上の 個の線分の集合 を考えます。全ての線分は 上の点と 上の点を結んでいて、 個の端点は重ならないとします。
-
どの線分も交わらない の部分集合で最大のものを計算するアルゴリズムを説明、解析してください。
-
全ての線分の組が交わるような の部分集合で最大のものを計算するアルゴリズムを説明、解析してください。
今度は平面上の 個の線分の集合 で、全ての線分の端点が単位円 上にあり、 個の端点が重ならないものを考えます。
-
どの線分も交わらない の部分集合で最大のものを計算するアルゴリズムを説明、解析してください。
-
全ての線分の組が交わるような の部分集合で最大のものを計算するアルゴリズムを説明、解析してください。
-
-
を単位円周上に均等に分布した 個の点、 を両端点が に含まれる 個の線分の集合とします。 に含まれる 個の線分の両端点は重ならないとは限りません。また は より極端に小さい可能性があります。
-
含まれるどの線分の組も共通元を持たない の部分集合のうち最大のものを計算するアルゴリズムを説明、解析してください。線分の組が共通元を持たない (disjoint である) とは、共通の点が端点を含めて無いことを言います。
-
含まれるどの線分の組も内部に共通元を持たない の部分集合のうち最大のものを計算するアルゴリズムを説明、解析してください。線分の組が内部に共通元を持たない (interior-disjoint である) とは、共通の点が全く無いか、あっても端点一つだけであることを言います。
-
含まれるどの線分の組も交わる の部分集合のうち最大のものを計算するアルゴリズムを説明、解析してください。交点が端点であっても構いません。
-
含まれるどの線分の組も交差する の部分集合のうち最大のものを計算するアルゴリズムを説明、解析してください。線分の組が交差 (cross) するとは、交わってかつ交点が端点でないことを言います。
満点のためには、四つのアルゴリズムは全て 時間で実行されることが求められます。
-
-
あなたは高速道路を走るバスを運転しています。バスは興奮しきったやんちゃな生徒でいっぱいであり、みな喉を乾かしています。バスにはソーダのドリンクバーが付いていて、バスに乗っている生徒は一分ごとに 1 オンスのソーダを飲みます。あなたの目標は生徒が飲むソーダの量を最小にしながら生徒を早く送り届けることです。
どのバス停で何人の生徒が降りるかをあなたは把握しています。バスは高速道路の (おそらくは端ではない) どこかから出発し、一定の速度毎時 37.4 マイルで進みます。バスは高速道路だけを使って移動しますが、あるバス停についた後に元来た方向に出発することは許されています (バスを止めて、生徒を下ろして、方向を変えて出発することは瞬時に行えます)。
ソーダの消費量を最小にするように生徒の降ろす効率の良いアルゴリズムを説明してください。入力はバスのルート (バス停の名前とバス停の間の距離) と各バス停で降りる生徒の人数、バスの初期位置 (バス停のうちどれか) からなります。
-
文字列 の要約 (summary) を、次の形をした部分文字列を結合したものと定義します:
-
は最初の文字列 にだけ含まれる という部分文字列を表す。
-
は 両方に含まれる部分文字列 を表す。
-
は二番目の文字列 にだけ含まれる という部分文字列を表す。
要約が有効 (valid) であるとは、要約をこのルールに沿って (分割記号を無視しながら) 結合したときに が復元できることを言います。通常の文字は の長さを持ち、分割文字 は非負の長さ を持つとします。要約の長さは文字と分割記号の長さの和です。例として、 と の有効な要約とその長さを示します:
-
の長さは です。
-
の長さは です。
-
の長さは です。
-
の長さは です。
与えられた二つの文字列 と の最短の要約の長さを求めるアルゴリズムを説明、解析してください。入力には の長さも含まれます。例えば:
-
と と が入力のとき、答えは です。
-
と と が入力のとき、答えは です。
-
と と が入力のとき、答えは です。
-
-
Vankin's Mile は の格子状の盤を使って遊ぶ一人用ゲームです。プレイヤーは好きなところに駒を置いてからゲームを始め、ターンごとに駒を右または下に動かし、駒が盤の端についたらゲーム終了です。盤のマスには実数が書かれていて、プレイヤーのスコアはゲームが終わるまでに通ったマスに書かれている数字の和です。ゲームの目標はなるべく多くのポイントを集めることです。
例えば次の盤が与えられたとき、二行目の からゲームを始めて下、下、右、下、下と進むことで 点を獲得できます (この点数はこの盤に対する最高得点ではありません)。
-
盤を表す の二次元配列が与えられたときに、Vankin's Mile で獲得できる最高得点を計算する効率の良いアルゴリズムを説明、解析してください。
-
このゲームのヨーロッパ版は Vankin's Kilometer というヨーロッパらしい名前をしています。このゲームはルールが少し違っていて、プレイヤーは右、下だけでなく左にも移動できます。ただし無限ループを避けるために一度通ったマスは以降通れないものとします。盤を表す の二次元配列が与えられたときに、Vankin's Kilometer で獲得できる最高得点を計算する効率の良いアルゴリズムを説明、解析してください4。
-
-
要素が と からなる のビットマップ が与えられたとします。 という形をした部分が全て同じ要素を持っているとき、それを の一様区画 (solid block) と言います。一様区画の行の数と列の数が等しいとき、正方 (square) であると言います。
-
に含まれる最大の正方一様区画の大きさを 時間で求めるアルゴリズムを説明してください。
-
に含まれる最大の一様区画の大きさを 時間で求めるアルゴリズムを説明してください。
-
に含まれる最大の一様区画の大きさを 時間で求めるアルゴリズムを説明してください。 [ヒント: 分割統治]
-
❤ に含まれる最大の一様区画の大きさを 時間で求めるアルゴリズムを説明してください。
-
-
の形をした実数配列が与えられたときに、長方形の部分列 で要素の和が最大のものを求めるアルゴリズムを説明してください。満点のためには実行時間が であることが求められます。 [ヒント: 練習問題 3.2]
-
与えられたビットマップに二回以上出現する最大の長方形パターンを見つけるアルゴリズムを説明、解析してください。つまり二次元配列 が与えられたときに、 に繰り返し現れる最大の長方形パターンの面積を計算してください。例えば次の図の左に示すビットマップが入力されたとき、条件を満たす最大の長方形パターンは 15 13 のワン公なので、アルゴリズムの出力は 195 です (この例では二つのパターンは重なっていませんが、重なっていても構いません)。
-
満点のためには、 時間で実行されるアルゴリズムを説明してください。
-
❤ ボーナス点のためには、 時間で実行されるアルゴリズムを説明してください。
-
♣ ❤ さらなるボーナス点のためには、 時間で実行されるアルゴリズムを説明してください。
-
-
を平面上の凸 (convex) な点集合とします。直感的に言うと、 に含まれる点の周りに輪ゴムを張ると全ての点が輪ゴムと接します。きちんと言うと、 任意の について と他の全ての点を分ける直線が存在します。この点集合に対して、 一番左にある点 から始めて "輪ゴム" を反時計回りにたどることで と名前を付けます。
この問題で解くのは巡回セールスマン問題の特別の場合です。つまりセールスマンは通常通り の全ての点を訪れますが、 から に移動するに移動するときのコストはユークリッド距離 とします。
-
の最短の環状な周遊 (tour)を求める単純なアルゴリズムを説明してください。
-
周遊が単純 (simple) であるとは自分自身と交差しないことを言います。今考えている の最短の周遊は単純でなければならないことを証明してください。
-
左端の点 から始まって右端の点 で終わる最短の周遊を計算する効率の良いアルゴリズムを説明、解析してください。
-
終点に制限のない の最短の周遊を計算する効率の良いアルゴリズムを説明、解析してください。
-
-
❤ 巡回セールスマン問題を 時間で解くアルゴリズムを説明、解析してください。アルゴリズムには辺に重みの付いた 頂点の無向グラフ が与えられ、アルゴリズムが返すのは全ての頂点をちょうど一回ずつ通る一番軽い巡回路の重さ、あるいはそのような巡回路が存在しない場合には です。 [ヒント: バックトラッキングを使った自明な再帰的アルゴリズムの実行時間は です。]
-
を固定されたアルファベット に対する文字列の有限集合とします。 の編集中心 (edit center) とは文字列 であって に属する文字列との編集距離の最大値が最小になるものを言います。編集半径 (edit radius) とは編集中心と に属する文字列との編集距離の最大値のことです。文字列の集合は複数の編集中心を持つことがありますが、編集半径は一つしか持ちません。
-
与えられた三つの文字列の編集中心を計算するアルゴリズムを説明、解析してください。
-
♣ ❤ 任意の文字列集合の編集半径を最悪でも真の値から 倍の範囲で近似する効率の良いアルゴリズムを説明、解析してください (文字列の数が固定されていない場合、編集距離の真の値を求めるのは NP 困難です)。
-
-
❤ から の一桁の整数からなる配列 について、 のデジタル部分列 (digital subsequence) とは の互いに重ならない部分文字列を元の配列と同じ順番に並べたものを、通常の数字の列として読んだときの列です。例えば 3, 4, 5, 6, 8, 9, 32, 38, 46, 64, 83 は、円周率の最初の部分の数列としたときのデジタル部分配列です:
デジタル部分配列の長さを含まれる数字の数として定義します (含まれる数字の桁数の和ではありません)。この例では長さは 12 です。通常の配列と同じように、全ての数が一つ前の数よりも大きい場合デジタル部分配列を増加 (increasing) であると言うことにします。
の最長増加デジタル部分配列を計算する効率の良いアルゴリズムを説明、解析してください。 [ヒント: 計算量に関する仮定に注意! 桁の数の比較演算の実行時間はいくつですか?]
満点のためには、アルゴリズムの実行時間が であることが求められます。これよりも速いアルゴリズムにはボーナス点が付きます。私が知っている範囲で最速のアルゴリズムの実行時間は です。この実行時間を達成するにはアルゴリズムの設計と解析にいくつかのトリックが必要ですが、全てこの講義の範囲に収まっています 5。
-
❤ 古典的な Hanoi の塔問題を次のように改変したものを考えます。通常の問題と同じように 枚の異なる大きさの円盤と と番号のついた つの杭があり、最初 枚の円盤は全て杭 に置かれ、大きいものが一番下で、上に行くほど小さくなるようになっています。目標は全ての円盤を杭 に移動させることです。行うことができる操作はある杭の一番上に載っている円盤一つを別の杭に移動させることだけであり、この操作には従わなければならないルールがあります。まず、円盤をそれよりも小さな円盤の上に置くことはできません。次に、これが標準の問題との唯一の違いなのですが、杭 から杭 に円盤を直接移動させることはできません。
このルールの下で、 枚の円盤全てを杭 から杭 に移動させるための最小の操作数を求めるアルゴリズムを説明、解析してください。満点を得るためには、最悪ケースでも 回の算術演算を使うことが求められます。解析のときには、 桁の数の加算と乗算命令の実行時間が であるとしてください。 [ヒント: 行列!]
列/配列の分割
-
基本算術式 (basic arithmetic expression) は と括弧から構成されます。ほぼ全ての整数について、その数を表す基本算術式は複数あります。 例えば次の基本算術式は全て 14 を表します:
が与えられたときに、 を基本算術式で表すために必要になる の数の最小値を求めるアルゴリズムを説明、解析してください。括弧の数は関係なく、1 の数だけを考えます。先ほどの の例では、最後の基本算術式に対応する が答えです。アルゴリズムの実行時間は次数の小さい多項式で抑えられるはずです。
-
と で区切られた整数列を与えられたとします。例えば次のような列です: これを式とみなした上で括弧を付けると、式が表す値が変化します:
と で区切られた整数列を受け取って、それを式とみなしたときに括弧を付けることで表すことができる値の最大値を求めるアルゴリズムを説明、解析してください。括弧は加算と減算をまとめるために使うことだけが許されています。 のように括弧を続けて書いて乗算を表すことはできません。
-
と で区切られた整数列を与えられたとします。例えば次のような列です: これを式とみなした上で括弧を付けると、式が表す値が変化します:
-
入力の整数が全て正だと仮定したときに、括弧を付けることで表すことができる値の最大値を求めるアルゴリズムを説明、解析してください。 [ヒント: この問題は簡単です。]
-
入力の整数が全て非負だと仮定したときに、括弧を付けることで表すことができる値の最大値を求めるアルゴリズムを説明、解析してください。
-
入力の整数に制約がない場合に、括弧を付けることで表すことができる値の最大値を求めるアルゴリズムを説明、解析してください。
算術演算は で実行できるとしてください。
-
-
あなたは Shampoo-Banana 大学を卒業し、ウォールストリートの Long Live Boole 銀行の就職面接を受けることに決めました。銀行のマネージャー Eloob Egroeg は新入りの従業員に対して制限時間が 24 時間の "解答か死か" 形式の問題を出して、この問題が解けなければその時点で首を切ると言います!
あなたが銀行に初めて入ると、従業員のオフィスは一列に並んでいて、それぞれのドアには "" あるいは "" と大きく印が付いていました。さらに隣り合うオフィスの間には の記号のどれか一つが書かれたボードがあります。この難解な記号について Eloob に尋ねたところ、 はブール値 と を表し、ボードに書いてある記号はブール演算の を表すと教えてくれました。また文字と記号は特定の従業員の組み合わせが一緒に上手く働けるかどうかを表しているとのことです。新しいプロジェクトを始めるとき、 Eloob は記号列の間に括弧を入れて曖昧性の無いブール式にすることで従業員をグループに分け、括弧を入れたブール式が に評価されるならばそのプロジェクトは成功するそうです。
例えば銀行に三人の従業員がいて、オフィスのドアとオフィスの間のボードに書かれている記号が だとすると、括弧をつけて全体を にする方法は の一つです。しかし記号列が だった場合、どう括弧を入れてもプロジェクトは失敗します。
そして Eloob が出した "解答か死か" の面接問題はこれです: 与えられた記号列に括弧を入れることで全体の式が に評価されるようにできるかどうかを判定するアルゴリズムを説明してください。アルゴリズムの入力は配列 であり、 が偶数のとき 、 が奇数のとき です。
-
南極カタツムリ同好会 Upper Glacierville 支部 (Antarctican Snail Lovers of Upper Glacierville) は毎年の会合で "円卓の友レース" を開催しています。 から までの番号がつけられた育ちの良いカタツムリが円卓の端に置かれた状態からスタートし、合図と共にねばねばした跡を残しながら卓上を動き回ります。カタツムリたちは自分と他のカタツムリの残した跡を横切らないように訓練されており、卓から落ちることもありません。二匹のカタツムリが出会うとそのカタツムリのペアは繁殖の準備ができたとみなされ、卓から取り除かれて子供を作るためのロマンチックな部屋に放り込まれます。このレースでは制限時間がなかったとしても相手を見つけられないカタツムリが出る場合があることに注意してください。
図 3.6レースの終了の一例を図示したもの。カタツムリ 6 と 8 は相手を見つけられない。主催者は を払う。円卓の友レース中に成立した全てのカタツムリのカップルに対して、Antarctican SLUG のレース主催者は祝い金を支払います。二次元配列 が円卓の後ろの壁に貼られており、カタツムリ と が出会ったときには が双方のカタツムリの飼い主に支払われます。
入力として が与えられたときに、主催者が払う必要が生じうる最高金額を計算するアルゴリズムを説明、解析してください。
-
あなたは採石場から大理石の大きな板を採掘しました。簡単のため、大理石の板は横 インチ、縦 インチの長方形だとします。キッチンカウンター、彫刻、墓石などで使うために、この大理石から様々な形の小さな長方形を切り出したいとします。
あなたは任意の大きさの長方形の大理石を水平あるいは垂直にカットできる大理石カッターを持っています。また横 インチ、縦 インチの大理石の板の値段を表す配列 があり、いつでも参照できます。この値段は客の需要によって決まっていますが、キッチンカウンターで使う大理石を買いに来るお客というのは少し変わっているので、彼らについて常識的な仮定を置かないでください。つまり、大きい板が小さい板よりも極端に低い値段で売れることもあります。
横 インチ、縦 インチの板の値段を表す配列と板のサイズ を入力として受け取って、売り上げを最大化する インチの板の分割方法を計算するアルゴリズムを説明してください。
-
この問題では特定の制約を満たす最適二分探索木を構築する効率の良いアルゴリズムを設計してもらいます。入力はソート済みの鍵配列 と頻度数配列 であり、 が に対する探索の回数を表します。問題は基本的に以前に示したものと同じですが、ここでは追加の制約があります。
-
AVL 木 (AVL tree) は自動的にバランスが保たれる二分探索木のうち最初に発見されたものであり、1962 年に Georgy Adelson-Velsky (ゲオルギー・アデルソン・ヴェルスキー) と Evgenii Landis (エフゲニー・ランディス) によって提案されました。AVL 木では任意の頂点 について、 の左右の部分木の高さは最大でも しか違いません。
鍵と頻度を表す配列を受け取って最適な AVL 木を返すアルゴリズムを説明、解析してください。
-
対称二分 B 木 (symmetric binary B-tree) も自動的にバランスが保たれる二分木であり、1972 年にRudolf Bayer (ルドルフ・ベイヤー) によって提案されました。1978 年に Robert Sedgewick (ロバート・セッジウィック) と Leonidas Guibas (レオニダス・ギバス) によって単純な形に変形され、現在では赤黒木 (red-black tree)という名前で知られています。
赤黒木は次の制約を持つ二分探索木です:
- 全ての頂点は赤または黒である。
- 赤い頂点の親は黒い。
- 根から葉への任意の道は同じ数の黒い頂点を含む。
鍵と頻度を表す配列を受け取って最適な赤黒木を返すアルゴリズムを説明、解析してください。
-
AA 木 (AA tree) は 1993 年に Arne Andersson (アルネ・アンデルソン) によって提案され、2000 年に Mark Allen Weiss (マーク・アレン・ウェイス) によって単純化され (そして名前を付けられ) ました。2006 年には Robert Sedgewick によって鏡写しの (バランスを保つためのアルゴリズムが異なる) データ構造が提案されていますが、このデータ構造は "AA 木" ではなく "左に傾いた赤黒木" と呼ばれました。
AA 木は次の追加の制約を持つ赤黒木です:
- 左の子は赤くない6。
鍵と頻度を表す配列を受け取って最適な AA 木を返すアルゴリズムを説明、解析してください。
-
-
と からなる のビットマップ が与えられたとします。 という形をした部分が全て同じ要素を持っているとき、それを の一様区画 (solid block) と言います。 をなるべく少ない数の互いに重ならない一様区画に分割したいとします。
この問題に対する単純な再帰的戦略の一つに、ギロチン分割と呼ばれるものがあります。ギロチン分割は が一様区画であれば何もせず、そうでなければ水平または垂直に を分割して両方の部分を再帰的に一様区画に分割するというものです。
任意のギロチン分割は二分木で表せます。この二分木の頂点は分割の場所と方向を保持し、葉は対応する一様区画の要素 または を保持します。ギロチン分割のサイズとは対応する二分木の葉の数 (つまり、最終的に残る一様区画の数) であり、ギロチン分割の深さとは対応する二分木の深さです。
-
のギロチン分割でサイズが最小なものを計算するアルゴリズムを説明、解析してください。
-
ギロチン分割を使った分割をしても常に一様区画の数が最小になるわけではないことを示してください。
-
のギロチン分割で深さが最小なものを計算するアルゴリズムを説明、解析してください。
-
のギロチン分割を表す二分木と添え字 から を計算するアルゴリズムを説明、解析してください。
-
ギロチン分割におけるピクセル の深さを、ギロチン分割を表す二分木におけるそのピクセルが含まれる葉の深さとして定義します。 のギロチン分割でピクセルの深さの和が最小なものを計算するアルゴリズムを説明、解析してください。
-
のギロチン分割で黒いピクセルの深さの和が最小なものを計算するアルゴリズムを説明、解析してください。
図 3.7サイズ 、深さ のギロチン分割 -
-
♠ おめでとうございます!あなたは巨大オンライン書店 DeNile ("Not just a river in Egypt!") に雇われ、倉庫ロボットを最適化する仕事をすることになりました。DeNile が販売する全ての本には ISBN (Internatinal Standard Book Number) というユニークな数字が付いています。DeNile の倉庫には箱が一列に並んでおり、それぞれの箱には一種類の本が何冊か入っています。この箱は ISBN によってソートされており、ISBN は箱の表面に機械が読める形式で書かれています。書店が注文を受けると、箱の列に沿って移動できるロボットが本を取りに行きます。
DeNile にはどの箱にどの ISBN が入っているかのリストを持っていません (問題が簡単になりすぎます!)。その代わり、ロボットは本を取りに行くたびに二分探索を行います。探索にはロボットの物理的な動作が関わるために、探索の各ステップが 時間で終わるという仮定は成り立たなくなります。つまり:
-
ロボットは常に 0 番目の箱から探索を始める (配送用の箱がここにある)。
-
番目の箱から 番目の箱に移動するには 秒かかる ( は定数)。
-
箱の ISBN を読み取るためには箱の真正面にいなければならない。ISBN の読み取りには 秒かかる ( は定数 )。
-
ロボットの方向を変えるには 秒かかる ( は定数 )。
-
ロボットが目的の箱を見つけたら、箱から本を取り出して 0 番目の箱の場所に戻る。
ロボットによる箱の探索を最短にする二分探索木を計算するアルゴリズムを説明、解析してください。アルゴリズムの入力は整数配列 であり、 が 番目の箱にある本を取りに行く回数を表します。 も入力として与えられます。
-
-
♠ 探索木のキャッシュパフォーマンスを向上させるためによく使われる方法の一つに、鍵と部分木を通常よりも多く頂点に格納するというものがあります。B-木 (B-tree) とは、葉でない頂点が最大 個の鍵と最大 個のより小さい B-木 (子) へのポインタを格納している根付き木です。具体的に言うと、B-木の頂点 は三つのフィールドを持ちます:
- 正の整数
- ソート済みの配列
- 子へのポインタの配列
この制約は頂点の子の数が鍵の数よりちょうど一つ多くなることを表しています7。
ポインタ は または他の B-木の根へのポインタです。 が木の根を指す場合、その木は より大きく よりも小さい鍵を保持します。また左端の部分木 は よりも小さい鍵を、右端の部分木 は よりも大きい鍵をそれぞれ保持します。
直感的には、次のような図を思い浮かべることができるはずです:
図中の は によって指される部分木です。
B-木の鍵 に対する探索コストとは根から を含む頂点への道の長さです。また 1-木は二分探索木です。
整数 を固定します (実際のコードでは が推奨されます)。ソート済みの鍵配列 と頻度を表す配列 が与えられ、 が の探索される回数を表すとします。この問題の目標は合計探索時間が最小となる B-木を構築する効率の良いアルゴリズムを説明、解析することです。
-
特殊ケース に対する多項式時間アルゴリズムを説明してください。
-
任意の に対して、実行時間が整数定数 を使って と表されるアルゴリズムを説明してください。
-
❤ 任意の に対して、実行時間が整数定数 を使って と表される ( に依存しない) アルゴリズムを説明してください。
-
丸括弧 と鍵括弧 からなる文字列 のバランスが取れている (balanced) とは、次の条件のうちどれかを満たすことを言います:
- は空文字列である。
- バランスの取れた文字列 を使って と表せる。
- バランスの取れた文字列 を使って と表せる。
- バランスの取れた文字列 を使って と表せる。
例えば はバランスの取れた文字列です。なぜなら次のように を定義すると であり、 と がバランスの取れた文字列だからです:
-
入力として丸括弧と鍵括弧からなる文字列が与えられます。この文字列のバランスがとれているかどうかを判定するアルゴリズムを説明、解析してください。
-
入力として丸括弧と鍵括弧からなる文字列が与えられます。この文字列のバランスがとれている部分列で最長のものの長さを計算するアルゴリズムを説明、解析してください。
-
入力として丸括弧と鍵括弧からなる文字列が与えられます。この文字列のバランスがとれている超配列で最短のものの長さを計算するアルゴリズムを説明、解析してください。
-
入力として丸括弧と鍵括弧からなる文字列が与えられます。丸括弧と鍵括弧のバランスがとれている文字列とこの文字列との間の編集距離の最小値を計算するアルゴリズムを説明、解析してください。
-
❤ 入力として丸括弧と鍵括弧からなる二つの文字列が与えられます。二つの文字列のバランスの取れた最長共通部分列を計算するアルゴリズムを説明、解析してください。
-
❤ 入力として丸括弧と鍵括弧からなる文字列が与えられます。この文字列のバランスが取れていてかつ回文である部分列で最長のものを計算するアルゴリズムを説明、解析してください。
-
❤ 入力として丸括弧と鍵括弧からなる二つ文字列が与えられます。二つの文字列のバランスが取れていてかつ回文である共通部分列で最長のもの (!!!) を計算するアルゴリズムを説明、解析してください。
いずれの問題でも、入力は です。
-
おめでとうございます!あなたは DARPA, Google, McDonald が出資する 5000 万ドルのプロジェクトを勝ち取りました。このプロジェクトでは、プログラマーの脳を読む世界初のコンパイラ DWIM を作成します!研究提案書と数えきれないプレスリリースで、あなたは DWIM が任意のコード片に含まれるエラーを自動的に修正し、そのときのコードの改変は最小限であると宣伝してきました。そして残念なことに、このブツを実際に作る時間がついにやってきました。
あなたはウォーミングアップとして、次の小さな問題に取り組むことにしました。二つの文字列の間の編集距離とは、一文字の挿入、削除、置換を使って片方の文字列をもう片方の文字列に変形するときに必要になる操作の回数の最小値であることを思い出してください。また が算術式であるとは、次の条件を満たすことを言います:
- が一つ以上の数字の桁からなる文字列である。
- 算術式 を使って と表せる。
- 算術式 と二項演算子 を使って と表せる。
アルファベット ( は一桁の数、 は二項演算子 ) からなる文字列が与えられたときに、その文字列から算術式への編集距離の最小値を求めるアルゴリズムを説明、解析してください。
-
リボ核酸 (RNA) 分子はヌクレオチド (基) が数百万個つながった長い鎖であり、基にはアデニン ()、シトシン ()、グアニン ()、ウラシル () の四種類があります。RNA 分子の配列は文字列 で表され、各 が基に対応します。鎖上で隣り合う分子同士の化学結合に加えて、ある条件を満たす基の間には水素結合が作られます。水素結合で結合した基の組とRNA 配列の全体を指して RNA 分子の二次構造と言います。
二つの基の組 と ( かつ ) が重なるとは、 または が成り立つことを言います。現実の二次構造はほとんどの組は重なっていません。重なる基の組は二次構造でいわゆる pseudoknots を形成しますが、これは予測が困難です。
与えられた RNA 配列に対する最良の二次構造を予測したいとします。二次構造のモデルとして、次の大胆に単純化したモデルを使います:
- 基は多くとも一つの他の基と結合する。
- A-U と C-G の組だけが結合できる。
- と という形の基は結合できない。
- 結合する基の組同士は重なってはいけない。
最後の (全く現実的でない) 制限があるので、RNA の二次構造を太った木 (fat tree) に近いものを使って可視化できます:
図 3.8. RNA の二次構造の例。赤線で示された 21 個の結合ペアを持つ。ギャップは破線で囲まれている。この構造のスコアは である。-
与えられた RNA 配列が構成できる結合組の数の最大値を求めるアルゴリズムを説明、解析してください。
-
二次構造におけるギャップ (gap) とは組になっていない極大の部分文字列のことを言います。大きなギャップは科学的に不安定なので、小さなギャップを持つ構造が多く出現します。この傾向を取り入れるために、二次構造のスコアをギャップの長さの二乗和として定義します。例としては上図を見てください (このスコア関数は全く人工的なものです。現実の RNA 構造予測にはこれよりずっと複雑なスコア関数が必要になります)。
RNA 配列が与えられたときに、二次構造の最小スコアを計算するアルゴリズムを説明、解析してください。
-
♣ 正規表現の演算は (連結)、 (和集合)、 (Kleene 閉包) の三つとします。
-
文字列 と正規表現 が与えられたときに、 かどうかを判定する効率の良いアルゴリズムを説明、解析してください。
-
一般化された正規表現 (generalized regular expression) とは普通の正規表現に二項演算子 (共通部分) と単項演算子 (補集合) を加えたものです。一般化された正規表現に対応する NFA が構築できることと Kleene の定理から、一般化された正規表現 が表す言語 が正規であることが言えます。
文字列 と一般化された正規表現 が与えられたときに、 かどうかを判定する効率の良いアルゴリズムを説明、解析してください。
木と部分木
-
-
あなたは Abugida の子会社 Giggle, Inc で行われる初めてのホリデーパーティ (強制参加) の幹事となりました。Giggle の従業員の間には社長を根とした木で表される厳格な上下関係があり、人事部にある全能のオラクルは全ての従業員の "面白さ" を知っています。
パーティが社交的になるように、ある従業員がパーティに出席できるのはその直属の上司がパーティに参加するときだけと決まっています。ただし、社長は面白さの評価が負にもかかわらずパーティに必ず参加します (結局、この会社は彼女のものですから)。面白さの評価の和を最大化する出席者のリストを作成するアルゴリズムを示してください。
-
昨年のホリデーパーティの参加者があまりにも少なかったことから、Giggle の社長は今年はパーティの代わりに全ての従業員にプレゼントを渡すことを決めました。具体的には、従業員は次の三つのうち一つを受け取れます: (1) 世界の好きなところで過ごせる六週間の無料休暇 (2) Jumping Jack Flash's Flapjack Stack Shack の朝食パンケーキ食べ放題券ペア (3) 犬の糞が詰まった燃え盛る紙袋。
直属の上司と同じプレゼントを受け取ることはできないことが社則で決まっています。また直属の上司よりも上等なプレゼントを受け取った従業員は、嫉妬した上司によって首を切られてしまうでしょう。
Giggle の公式パーティを統べる者として、どの従業員がどのプレゼントを受け取るかを決めるのはあなたの仕事です。解雇される従業員の数が最小となるようにプレゼントを配るアルゴリズムを説明してください。ええ、社長に燃え盛る犬の糞を送り付けることもできます。
図 3.9コストが の割り当て。赤い頂点が親よりも小さい値を割り当てられた頂点を表す。これはこの木に対する最適な割り当てではない。きちんと問題を定義すると、会社の上下関係を表す根付き木 が与えられたときに、各頂点に のどれかを割り当てます。割り当てのコストを親よりも小さな値が割り当てられる頂点の数としたときに、コストが最小となる への割り当てを求めるアルゴリズムを説明、解析してください。
-
燃え盛る犬の糞の大失敗を見たあなたは大急ぎで他の職を探し、Giggle を離れてそのライバル会社 Twitbook に移りました。不幸なことに、Twitbook の新しい社長は Giggle のホリデーパーティーと同じことをやってみようとちょうど決断したところで、あなたの過去の経験を見た社長はあなたを公式パーティーの幹事に抜擢しました。社長の命によると、社長を含むちょうど 人の従業員を招待し、全員の参加を強制しなければならないとのことです。面白いことになってきました。
Giggle と同じように、 Twitbook の従業員の間は社長を根とした木で表される厳格な上下関係があります。また人事部にある全能のオラクルは全ての従業員の "気まずさ" を知っています。この値は従業員が直属の上司と上手く行っているかどうかを表します。例えば気まずさが負ならば、その従業員と直属の上司は上手く行っているということです。あなたの目標は従業員の中から 人を選んで、気まずさの和が最小になるようにすることです。例えば招待した従業員の中にある従業員とその直属の上司の組が一つも無いなら、気まずさの和は です。アルゴリズムの入力は木 , 整数 , 各頂点の気まずさです。
-
従業員の上下関係が二分木である、つまり全ての従業員に部下が最大でも二人しかいない場合に、 人の従業員の部分集合で気まずさが最小となるものを計算するアルゴリズムを説明、解析してください。
-
❤ 従業員の上下関係に制約が無い場合に、 人の従業員の部分集合で気まずさが最小となるものを計算するアルゴリズムを説明、解析してください。
-
-
根付き木の全ての頂点にメッセージを送りたいとします。最初にメッセージを知っているのは根の頂点だけで、各ラウンドでメッセージを知っている頂点は最大で一つの子にメッセージを送ることができます。例を次に示します:
図 3.105 ラウンドでメッセージが木の全ての頂点に行き渡る様子-
メッセージを二分木に含まれる全ての頂点に届けるために必要な最小のラウンド数を計算するアルゴリズムを作ってください。
-
♦ メッセージを任意の根付き木に含まれる全ての頂点に届けるために必要な最小のラウンド数を計算するアルゴリズムを作ってください。 [ヒント: このアルゴリズムは貪欲アルゴリズムではありませんが、正しさの証明には次の章で説明するテクニックが役に立ちます。]
-
-
ある日、ジムの壁を登るのに飽きた Alex は、クライマーの友達を大勢誘って屋外の壁を登りに行きました。彼らが訪れたクライミングエリアはとても横にとても長い岩で、あまり高くはありませんでした。岩には手足を掛ける場所 (ホールド) がたくさんありましたが、それを見た Alex は友達と話し合って "許されている" 動きを設定しました。ホールドの間を移動するときには、このルールに従わなければなりません。
ホールドと許されている動きは 頂点の根付き木 で表され、頂点がホールドに、辺が許されているホールド間の動きを表します。岩を上る道は上に行くほど小さくなり、最終的にホールド一つになります。このホールドが の根に対応します8。
Alex とその友達 (みな優秀なクライマーです) は、なるべく多い人数で岩を同時に上るというゲームをすることになりました。ただしクライマーはちょうど 回だけ岩を上に向かって登らないといけません。つまり、クライマーは の中で根に向かって長さ の道を描きます。加えて、一つのホールドを使えるのは一人のクライマーだけです。つまりクライマーの軌跡が交差してはいけません。
このゲームをプレイできる最大人数を計算する効率の良いアルゴリズムを説明、解析してください。きちんと言うと、根付き木 と整数 が与えられたときに、 の根に向かう長さ の互いに重ならない の路からなる集合の最大の大きさを計算してください。 が二分木だと仮定しないでください。次の例では であり、アルゴリズムの出力は整数 です。
図 3.11長さが である重ならない 7 つの道 (この集合は条件を満たす最大の集合ではない) -
を 頂点の根付き二分木、 を正の整数とします。 の頂点のうち 個に印をつけて、全ての頂点のなるべく近い祖先に印をつけた頂点があるようにしたいとします。きちんと言うと、 の頂点の部分集合 に対するクラスタリングコストを次のように定義し、これを最小化します: ここで は木に含まれる全ての頂点に関する最大値を表し、 は から に含まれる一番近い の先祖までの距離です: この定義から、 が の根を含まないならば であることが分かります。
図 3.12二分木の頂点の部分集合 (大きさは で、クラスタリングコストは )-
❤ 木 と整数 が与えられたときに、 頂点からなる の頂点の部分集合の中でクラスタリングコストが最小のものを計算する動的計画法のアルゴリズムを説明してください。満点のためには、アルゴリズムの実行時間が であることが求められます。
-
木 と整数 が与えられたときに、クラスタリングコストが 以下である の頂点の部分集合で最小のものを計算する動的計画法のアルゴリズムを説明してください。満点のためには、アルゴリズムの実行時間が であることが求められます。
-
(b) に対する答えを使うと (a) の問題に対する 時間の答えを得られることを示してください。
-
-
この問題では与えられた二つの木に対する共通根付き部分木を求める問題を考えます。根付き木とは根と呼ばれる頂点を持つ連結非巡回グラフであることを思い出してください。根付き部分木とは、ある頂点とその全ての子孫からなる根付き木のことです。 "共通" の意味はどのような根付き木の組を同型 (isomorphic) とみなすかによって異なります。
-
二分木では各頂点が左の部分木と右の部分木を持っており、空の部分木も許されています。二つの二分木が同型とは、どちらも空であるか、そうでなければ左の部分木同士と右の部分木同士がどちらも同型であることを言います。二つの二分木が与えられたときに最大共通部分二分木を計算するアルゴリズムを説明してください。
図 3.13二つの二分木 (最大共通部分二分木が強調してある) -
順序付き根付き木 (ordered rooted tree) では各頂点が子の列を持っており、それぞれの子は順序付き根付き部分木の根です。二つの順序付き根付き木が同型とは、どちらも空であるか、そうでなければ全ての添え字 について 番目の部分木同士が同型であることを言います。二つの順序付き根付き木が与えられたときに最大共通順序付き根付き部分木を計算するアルゴリズムを説明してください。
-
♦ ❤ 順序無し根付き木 (unordered rooted tree) では各頂点が子の集合を持っており、それぞれの子は順序無し根付き木の根です。二つの順序無し根付き木が同型とは、どちらも空であるか、そうでなければ全ての添え字 について 番目の部分木同士が同型であるように二つの木の根の子を順序付けられることを言います。二つの順序無し根付き木が与えられたときに最大共通順序無し根付き部分木を計算するアルゴリズムを説明してください。
-
-
この問題では根無し木 ――連結非巡回無向グラフ―― の最適部分木を効率良く計算するアルゴリズムを考えます。根無し木の部分木とは任意の連結部分グラフのことです。
-
根無し木 と辺の重みを与えられたとします。重みは正でもゼロでも負でもあり得るとしたとき、 内の道であって最大の重みを持つものを求めるアルゴリズムを説明してください。
-
根無し木 と頂点の重みを与えられたとします。重みは正でもゼロでも負でもあり得るとしたとき、 の部分木であって最大の重みを持つものを求めるアルゴリズムを説明してください。 [この問題は 2016 年の Google の面接試験で出題されました。]
-
を任意の順序付き根無し木とします。つまり、各頂点に隣接する頂点の集合は well-defined な環状の順序を持っているということです。 と の最大共通順序付き部分木を求めるアルゴリズムを説明してください。
-
♦ ❤ を任意の順序無し根無し木とします。 と の最大共通順序無し根無し部分木を求めるアルゴリズムを説明してください。
-
-
根付き木の根付きマイナー (rooted minor) とは部分列の自然な拡張です。根付き木 の根付きマイナーとは一つ以上の辺を縮約 (contraction) してできる任意の木のことを言います。頂点 とその親 を結ぶ辺 を縮約すると、 の子が の子となり、 は削除されます。また の根は の全ての根付きマイナーの根です。
図 3.14根付き木とその根付きマイナーの一つ-
を頂点にラベルの付いた根付き木とします。 の全ての頂点 について、 の子が全て同じラベルを持っているとき、 は退屈である (boring) と言います (違う頂点の子は違うラベルを持っていて構いません)。与えられたラベル付き根付き木 の退屈な根付きマイナーのうち最大のものを計算するアルゴリズムを説明してください。
-
を頂点に数字のラベルが付いている根付き木とします。 のヒープ順序付き (heap-ordered) 根付きマイナーのうち最大のものを計算するアルゴリズムを説明してください。つまり の根付きマイナーを とすると、アルゴリズムが返すのは、各頂点のラベルが子のラベルよりも小さいという条件を満たす の中で最大のものです。
-
を頂点に数字のラベルが付いている二分木とします。 の二分探索順序付き (binary-search-ordered) 根付きマイナーのうち最大のものを計算するアルゴリズムを説明してください。つまり の根付きマイナーを とすると、アルゴリズムが返すのは、各頂点が最大で二つの子を持ち、 の通り掛け順の走査が ( の通り掛け順の走査の部分) 増加列となるような のうち最大のものです。
-
根付き木が順序付いている (ordered) とは、各頂点の子が well-defined な左から右への順番を持っていることを言います。頂点が数字でラベル付けされた任意の順序付き木 に対して、その最大二分探索順序付き根付きマイナーを求めるアルゴリズムを説明してください。アルゴリズムが答える根付きマイナー の頂点における左から右への順序は のものと一致している必要があります。
-
❤ 二つのラベル付けされた順序付き根付き木に対して、最大共通順序付き根付きマイナーを求めるアルゴリズムを説明してください。
-
♦ ❤ 二つのラベル付けされた順序無し根付き木に対して、最大共通順序無し根付きマイナーを求めるアルゴリズムを説明してください。 [ヒント: 動的計画法と最大フローを組み合わせてください。]
-
-
私のアルゴリズムの講義では、動的計画法の解答にそれが解いている再帰的な小問題に対する英語で書かれた仕様が含まれていない場合、それ以外の答案が完璧であったとしても自動的に点数がゼロになります。このポリシーを導入したところ、生徒が間違った (あるいは支離滅裂な) 動的計画法のアルゴリズムを提出する回数が激減し、成績が劇的に向上しました。[return]
-
Nadiria の歴史と文化および夢ドル紙幣の画像は http://moneyart.biz/dd/ から参照できます。[return]
-
北コースを使えばスピードがもっと出ますが、対決に使うには短すぎます。[return]
-
Vaikin's killometer にさらに上方向の移動を加えた場合、このゲーム (Vankin's Fathom?) は NP 困難となります。[return]
-
もっと洗練されたテクニックを使えば実行時間を にできると私は信じていますが、まだ詳細を詰め切っていません。[return]
-
Sedgewick の提案したデータ構造は右の子が赤くてはいけないという制約を持っていましたが、まぁ、どうでもいいです。奇妙なことに、Andersson と Sedgewick は両人とも角度を測るときに時計周りに測るかそれとも反時計回りに測るか、冥王星が惑星がどうか、"lower rank" が意味するのが良いことなのかそれとも悪いことなのか、アヒルサイズの馬 100 匹と馬サイズのアヒル 1 匹だったらどちらと戦いたいかについては沈黙したままです。[return]
-
最悪探索時間 を保証するには、これらの他に二つの制約が必要となります: (1) 全ての葉が同じ深さを持つ (2) 根を除く全ての頂点が 個以上の鍵を持つ。しかしこの問題で考えているのは最悪探索時間ではなく合計探索時間なので、追加の制約は課しません。[return]
-
Q: どうしてあなたたち情報科学の教授は木の根が上にあると思っているのですか? A:外に出たことがないから![return]