目次
背景
- 高速なアプリケーションを動かすには C/C++ が有用
- Python だけでは重くなる処理があり、C++ を使う必要が出てきた
- この記事では、C++ が C と比べて何を追加しているのか、C++ らしい考え方を整理する
C++とは
C++ は、C をベースにしつつ、より大規模なプログラムを書きやすくするための機能を追加した言語。
C に対して、主に以下のような機能が追加されている。
- クラス
- コンストラクタ / デストラクタ
- 参照
- 関数オーバーロード
- 名前空間
- テンプレート
- STL
- 例外
virtualによるポリモーフィズム- RAII
- スマートポインタ
- move semantics
constexpr
C++ は単に「Cにクラスを足した言語」ではなく、
リソース管理、抽象化、型安全性、汎用プログラミングを強く意識した言語。
CとC++の大きな違い
C は、比較的シンプルな言語。
主に、
- 関数
- 構造体
- ポインタ
- 手動メモリ管理
を使ってプログラムを書く。
一方 C++ は、C の機能に加えて、
- オブジェクト指向
- ジェネリックプログラミング
- RAII による自動的なリソース管理
- 標準ライブラリによる便利なデータ構造
- コンパイル時処理
などを使える。
つまり C++ は、C よりも高い抽象度で書ける。
ただし、抽象度が高い一方で、機能が多く、言語仕様もかなり複雑。
C++の基本思想
C++ でよく言われる考え方に、zero-overhead abstraction がある。
これはざっくり言うと、
使わない機能のコストは払わない。
使う機能も、手書きと同じくらい効率的であるべき。
という考え方。
つまり C++ は、抽象化しながらも、できるだけ実行時の無駄を増やさないことを目指している。
たとえば std::vector やテンプレートは高級な仕組みに見えるが、うまく使えばかなり効率よく動く。
クラス
C++ の大きな特徴の1つがクラス。
クラスは、データと処理をまとめる仕組み。
| |
使う側はこう。
| |
C の struct は基本的にデータをまとめるものだったが、C++ の class はデータと関数を一緒に持てる。
struct と class の違い
C++ では struct もメンバ関数を持てる。
| |
C++ の struct と class の主な違いは、デフォルトのアクセス指定。
| |
つまり、以下は public。
| |
以下は private。
| |
コンストラクタ
コンストラクタは、オブジェクトが作られるときに自動で呼ばれる関数。
| |
使う側。
| |
C では初期化処理を自分で関数として呼ぶことが多い。
| |
C++ では、オブジェクト生成時に初期化処理を自動で走らせることができる。
デストラクタ
デストラクタは、オブジェクトが破棄されるときに自動で呼ばれる関数。
| |
C++ では、スコープを抜けたときに自動でデストラクタが呼ばれる。
| |
この仕組みが、C++ の RAII につながる。
RAII
RAII は Resource Acquisition Is Initialization の略。
日本語にすると少し分かりにくいが、ざっくり言うと、
リソースの確保と解放を、オブジェクトの寿命に結びつける
という考え方。
たとえば、ファイルを開いたら必ず閉じる必要がある。
C ではこう書く。
| |
でも途中で return したり、エラーが起きたりすると、fclose を忘れる可能性がある。
C++ では、オブジェクトのデストラクタに後始末を書ける。
| |
このように、リソース解放を自動化できるのが RAII。
C++ ではかなり重要な考え方。
参照
C++ には参照がある。
| |
使う側。
| |
結果として a は 11 になる。
C ならポインタを使うことが多い。
| |
C++ の参照は、ポインタよりも「別名」に近い。
| |
参照を使うと、ポインタより読みやすく書ける場面がある。
const
C++ では const がよく使われる。
| |
これは、
| |
という意味。
C++ では、大きなオブジェクトを関数に渡すときに、
| |
で受け取ることがよくある。
関数オーバーロード
C++ では、同じ名前の関数を引数違いで複数定義できる。
| |
使う側。
| |
C では同じ名前の関数を複数定義できない。
C++ では、引数の型や数によって呼び分けられる。
名前空間
C++ には名前空間がある。
名前の衝突を防ぐための仕組み。
| |
使う側。
| |
標準ライブラリの std::vector や std::string の std も名前空間。
| |
テンプレート
テンプレートは、型をパラメータにできる仕組み。
| |
使う側。
| |
型を省略できることもある。
| |
テンプレートを使うと、型に依存しない汎用的なコードを書ける。
C++ の STL もテンプレートを多用している。
STL
STLとは
STL は Standard Template Library の略。
C++ 標準ライブラリのうち、特に汎用データ構造とアルゴリズムの仕組みを指す言葉。
現在はやや広めに、「C++ 標準ライブラリの便利な部品群」くらいの意味で使われることも多い。
STL の中心になるのは以下。
- コンテナ
- アルゴリズム
- イテレータ
コンテナ
コンテナは、データを入れる箱。
代表例。
std::vector- 可変長配列
std::string- 文字列
std::map- キーと値の対応表
std::unordered_map- ハッシュマップ
std::set- 重複なし集合
std::deque- 両端キュー
std::list- 双方向リスト
例。
| |
アルゴリズム
アルゴリズムは、データを処理する関数群。
代表例。
std::sortstd::findstd::copystd::removestd::transform
例。
| |
この場合、
std::vectorがコンテナstd::sortがアルゴリズム
イテレータ
イテレータは、コンテナの中身をたどる仕組み。
代表的には以下を使う。
| |
例。
| |
vector でも set でも、似た形で処理できるのはイテレータのおかげ。
例外
C++ には例外処理がある。
| |
受け取る側。
| |
C ではエラーコードで失敗を返すことが多い。
| |
C++ では、エラーを例外として伝えることができる。
ただし、プロジェクトによっては例外を禁止することもある。
継承
C++ には継承がある。
| |
使う側。
| |
Dog は Animal の機能を引き継ぐ。
ただし、C++ では継承を使いすぎると設計が複雑になりやすい。
近年は、継承よりも合成を好む設計も多い。
virtual とポリモーフィズム
C++ では virtual 関数を使うことで、実行時に呼び出す関数を切り替えられる。
| |
使う側。
| |
このように、基底クラスのポインタ経由で派生クラスの関数を呼べる。
これをポリモーフィズムという。
vtable
C++ の virtual 関数は、実装上 vtable のような仕組みで実現されることが多い。
vtable は、仮想関数の呼び出し先を管理するための表。
ただし、vtable は C++ の言語仕様上「必ずこの形で実装しなければならない」と決まっているものではない。
あくまで、多くのコンパイラで使われる実装上の仕組み。
C には virtual やクラスがないため、言語機能としての vtable はない。
ただし C でも、関数ポインタを使えば vtable のような仕組みを手動で作れる。
スマートポインタ
C++ では、手動で new / delete を直接使うより、スマートポインタを使うことが多い。
代表例。
std::unique_ptrstd::shared_ptrstd::weak_ptr
std::unique_ptr
所有者が1つだけのポインタ。
| |
スコープを抜けると、自動で解放される。
| |
std::shared_ptr
複数箇所で所有を共有するポインタ。
| |
最後の所有者が消えたタイミングで解放される。
ただし、循環参照には注意が必要。
move semantics
C++11 以降では、move semantics が重要。
ざっくり言うと、
| |
たとえば std::vector や std::string のような大きなデータを扱うとき、コピーすると重い。
move を使うと、内部データの所有権を移して効率化できる。
| |
このあと、b が元の文字列データを受け取る。
a は有効なオブジェクトではあるが、中身は使わない方がよい。
auto
C++ では auto を使うと、型推論できる。
| |
STL と組み合わせると便利。
| |
イテレータの型は長くなりがちなので、auto がよく使われる。
範囲for文
C++ では範囲for文が使える。
| |
参照で受け取ることもできる。
| |
変更しないなら const 参照がよく使われる。
| |
constexpr
constexpr は、コンパイル時に計算できることを表す。
| |
この場合、value はコンパイル時に計算できる。
C++ では、実行時だけでなくコンパイル時に処理を行う仕組みが増えている。
C++ の便利さ
C++ の便利なところは、主に以下。
- C に近い低レベル制御ができる
- クラスでデータと処理をまとめられる
- RAII によってリソース管理を自動化できる
- STL によって便利なデータ構造を使える
- テンプレートで汎用的なコードを書ける
constや型システムで安全性を高められる- 必要ならかなり高速に書ける
C++ の難しさ
一方で、C++ はかなり難しい言語でもある。
理由は以下。
- 機能が多い
- 古い書き方と新しい書き方が混在している
- ポインタ、参照、所有権の理解が必要
- コンパイルエラーが長くなりがち
- テンプレート周りが複雑
- ABI やビルドシステムの知識も必要になる
new/deleteを雑に使うと危険- 未定義動作がある
そのため、現代的な C++ では、なるべく以下を使うことが多い。
std::vectorstd::stringstd::unique_ptrstd::shared_ptrauto- RAII
- STL アルゴリズム
逆に、できるだけ避けたいもの。
- 生の
new/delete - 不要な生ポインタ所有
- 手動のメモリ管理
- 巨大な継承階層
- グローバル変数の多用
まとめ
C++ は、C をベースにしながら、より大規模で安全なプログラムを書きやすくするための機能を追加した言語。
一言でまとめると、
C++ は、Cの低レベル制御に、抽象化・型安全・リソース管理・汎用プログラミングを足した言語。
さらにもう少しかみ砕くと、
- クラスでデータと処理をまとめる
- コンストラクタで初期化する
- デストラクタで後始末する
- RAII でリソース管理を自動化する
- 参照でポインタより自然に値を渡せる
- テンプレートで汎用的なコードを書ける
- STL で便利なデータ構造とアルゴリズムを使える
virtualで実行時ポリモーフィズムを使える- スマートポインタでメモリ管理を安全にしやすい
- move semantics で重いコピーを避けられる
C++ は覚えることが多いが、
「RAII」「STL」「所有権」「型を活かす」 を意識すると、かなり C++ らしい書き方に近づく。
