秘密鍵暗号と公開鍵暗号
最近,暗号分野の勉強をしているので,今回はそれに関する話です.
暗号
現代では様々な人が様々な形で情報を伝えています.その中には,誰かだけに伝えるべき秘密性の高い内容が含まれることがあります.自分の名前や年齢などの個人を特定することができる情報や自分の体重や休日の過ごし方などの社会的に知られることが憚られる情報はその例です.そんな秘密性の高い情報を相手に伝えつつも第三者には漏らさないために,暗号を使うのが有効です.以下の説明のために,ざっと用語を定義します.
2. 平文 (plaintext) ……暗号化する前の文.
3. 復号 (decryption) ……暗号化された文章を元の平文に戻す操作のこと.復号する関数をで表す.
4. 鍵 (key) ……暗号化する際に使われるパラメータ.暗号の手法によっては存在しないこともある.
暗号は情報の伝達を前提としているため,その枠組みは次の図で表すことができます*1.
学問的に研究される暗号には2種類,秘密鍵暗号 (secret key cryptography) と公開鍵暗号 (public key cryptography) とがあります.詳しくみていきます.
秘密鍵暗号の枠組み
秘密鍵暗号*2は,暗号化する鍵と復号する鍵が同一の暗号のことをいいます.例えば次のVernam暗号は秘密鍵暗号の一種です.Step1. 乱数を生成する*3.
Step2. 暗号化関数は*4
\begin{align}
\operatorname{Enc} (m) = m \oplus r.
\end{align}Step3. 復号関数は
\begin{align}
\operatorname{Dec} (y) = y \oplus r.
\end{align}
まずはこのプロトコルの正しさを確認します.Aさんが平文を伝えるとき,
\begin{align}
\operatorname{Dec}(\operatorname{Enc}(m)) &= (m \oplus r) \oplus r \\
&= m \oplus (r \oplus r) \\
&= m \oplus 0 \\
&= m
\end{align}となり,Bさんが復号して得た平文はAさんが伝えたかった平文と一致します.このように暗号のプロトコルがきちんと平文を伝達することを,今後は「正当性がある」と表現することにします*5.
このVernam暗号は乱数が秘密鍵であり,これが漏れない限りは他者に暗号文が漏れたとしても元の平文は特定できません.ちなみにこの暗号は後に述べる情報理論的に安全な暗号です.
Vernam暗号はなんだか強そうな安全性をもつので良さそうに見えます.しかしながら,よく考えると復号に使う乱数を相手にどう伝えるかが問題になります.この乱数をそのまま相手に伝えようとしてみましょう.暗号化に使った乱数は,平文と同じビット数になります*6.もし乱数をそのまま送ってしまったら,その乱数は容易に盗み見られてしまい,簡単に暗号が破られてしまいます.これでは意味がありません.一方でこの乱数をまたVernam暗号で暗号化したら……これでは同じことの繰り返しです.どうすれば良いのでしょう.何か別の暗号の枠組みが必要になりそうです.
公開鍵暗号の枠組み
公開鍵暗号はおおよそ次の3つのステージから構成されます.秘密鍵 (secret key) と公開鍵 (public key) を作り,公開鍵だけを公開する.
2. 暗号化 (encryption)
平文と公開鍵から暗号文を作る.暗号を作る関数をと書く*7.
3. 復号 (decryption)
秘密鍵を使って暗号文を平文に戻す.復号を行う関数をと書く.
公開鍵暗号にはElGamal暗号,RSA暗号,Paillier暗号などがあります.この3つはすべて代数学に基づいて構築された暗号です.
この公開鍵暗号を用いると,先ほどの共通鍵暗号のところで述べた「乱数をどう渡すか」という部分に関する一つの答えが得られます.
Aさんが平文をなんとかしてBさんに伝えたいとします.Bさんは乱数を受け取るために,公開鍵と秘密鍵を作り,公開鍵を公開しました.Aさんはこの公開鍵から暗号文*8を送ります.Bさんはこれを自分しか知らない秘密鍵で復号します.これでAさんたちは盗聴者に知られずして乱数を共有することができました.めでたしめでたし!*9
安全性
暗号を学ぶ上で重要になる概念が「安全性 (security)」です.その安全性には次の2つの種類があります.1つ目が情報理論的安全性 (information-theoretic security) です.暗号を破ろうとしている第三者が「平文はこれだ」と答える状況を考え,彼の解答を確率変数とみなしてとおきます.正しい平文をとしたとき,を伴う暗号方式が情報論的安全であるとは,
\begin{align}
P(Y = m\,|\, \operatorname{Enc}(m) ) = P(Y=m)
\end{align}が成り立つことを言います.標語的に言えば,「を知っていても,当てずっぽうに平文を推測する人と正解率は変わらない」ということになります.先に述べたVernam暗号は情報理論的に安全な暗号です.
2つ目が計算量的安全性(computational security) です.これは,当てずっぽうに平文を推測する場合の計算量より小さい計算量で暗号を破ることができない場合に用いられます.しばしば問題の難しさに関する適当な仮定を伴って用いられる概念です.例えば先に紹介したEl Gamal暗号はCDH仮定*10のもとで計算量的に安全といえます.
計算量的安全性は適当な仮定のもとで保証された安全性なので,その仮定が誤りだと分かれば立ちどころに安全性が失われるものとなります.一方で,量子コンピュータによる計算が実用化されれば,今は情報理論的に安全とされている暗号も実は安全でなくなってしまう可能性もあります.量子コンピュータ技術の発展が目覚ましい現代において,この先の暗号がどうなっていくかは興味深いところですが,今回はそこには足を踏み入れないでおきます.
参考文献
- Wikipediaの暗号に関する記事. (暗号 - Wikipedia)
- 光成滋生. クラウドを支えるこれからの暗号技術. 秀和システム. 2019.
*1:暗号分野ではしばしば暗号文を作って情報を送る側をAlice,受け取る側をBobなどと名前を付けます.
*3:実は乱数の生成にも注意が必要で,暗号には特別な乱数が用いられます.
*5:correctnessの訳語のつもりでそう呼んでいます.
*6:排他的論理和を取るためには同じビット数,つまりビットの列が必要になります.
*7:細かいことですが,この関数は確率的アルゴリズムである必要があります.公開鍵もも知っている第三者の立場に立つと,決定的アルゴリズムであるとどうしていけないのかが分かります.ぜひ考えてみてください.
*8:共通鍵暗号の暗号化関数と区別するためにプライム記号をつけました.
*9:さて,乱数を受け取ったBさんはAさんからのメッセージを復号します.そこでふと思うのです.「あれ? だったら元の平文をさっきの公開鍵暗号で送れば良かったのでは?」と.
*10:CDH仮定とは,「からの値を求める」問題 (DH問題) が困難とする仮定のことです.