文字列string は、文字が連結されたものです。PHP では、 文字は 1 バイトと同じです。つまり、256 個の異なる文字を使用可能です。 これは、PHP が Unicode をネイティブにサポートしていないことも意味します。 文字列型の詳細を参照ください。
構文文字列リテラルは、4 つの異なる方法で指定することが可能です。 引用符
文字列を指定する最も簡単な方法は、引用符 (文字
引用符をリテラルとして指定するには、バックスラッシュ
(
二重引用符
文字列が二重引用符 (
繰り返しますが、この他の文字をエスケープしようとした場合には、 バックスラッシュも出力されます! しかし、二重引用符で括られた文字列で最も重要なのは、 変数名が展開されるところです。詳細は、文字列の補間を参照ください。 ヒアドキュメント
文字列を区切る別の方法としてヒアドキュメント構文 ("<<<")
があります。この場合、ある ID (と、それに続けて改行文字)
を 終端ID は、スペースまたはタブでインデントできます。 その場合、インデントされた部分は文字列の全ての行から取り除かれます。 PHP 7.3.0 より前のバージョンでは、 終端ID はその行の最初のカラムから始めなければ いけませんでした。 また、終端ID は、PHP の他のラベルと同様の命名規則に従う必要があります。 つまり、英数字およびアンダースコアのみを含み、 数字でない文字またはアンダースコアで始まる必要があります。 例1 PHP 7.3.0 以降での、基本的なヒアドキュメントの使い方
上の例の PHP 7.3 での出力は、このようになります。 a b c a b c 終端ID が、文字列のいずれかの行より奥にインデントされている場合、 ParseError がスローされます。 例2 終端ID は 文字列本体よりも奥にインデントしてはいけない
上の例の PHP 7.3 での出力は、このようになります。 PHP Parse error: Invalid body indentation level (expecting an indentation level of at least 3) in example.php on line 4 終端ID をインデントする場合、 インデントに使う文字として、タブまたはスペースが使えます。 しかし、終端ID、および (終端ID までの)文字列の本体どちらであっても、 インデントする際にタブとスペースを混ぜては いけません。 混ぜた場合、 ParseError がスローされます。 インデントに使う文字に制限があるのは、 タブとスペースを混ぜてしまうと可読性が損なわれるためです。 例3 文字列本体 や 終端ID のインデントに違う文字を使う
上の例の PHP 7.3 での出力は、このようになります。 PHP Parse error: Invalid indentation - tabs and spaces cannot be mixed in example.php line 8 文字列本体の後に置かれる 終端ID の後に、 セミコロンや改行を続ける必要はありません。 たとえば、次のようなコードが PHP 7.3.0 以降で動作します: 例4 終端ID の後に式を継続する
上の例の PHP 7.3 での出力は、このようになります。 array(2) { [0] => string(11) "a b c" [1] => string(5) "d e f" } 警告
終端ID が行のはじめに見つかった場合、 それが別の単語の一部かどうかにかかわらず、 それが終端IDと見なされ、 ParseError が起きる可能性があります。 例5 文字列本体に 終端ID が含まれると、ParseError が起きがち
上の例の PHP 7.3 での出力は、このようになります。 PHP Parse error: syntax error, unexpected identifier "ING", expecting "]" in example.php on line 6 この問題を避けるために、 次のようなシンプルなルールに従っておくと安全です: 文字列本体に出現するテキストを、終端ID として採用しない 警告
PHP 7.3.0 より前のバージョンで注意すべき非常に重要な点は、
終端ID がある行には、セミコロン
( この規則が破られて 終端ID が "clean" でない場合、 終端ID と認識されず、PHP はさらに終端 ID を探し続けます。 適当な 終端ID がみつからない場合、 スクリプトの最終行でパースエラーが発生します。 例6 PHP 7.3.0 より前のバージョンでの間違った例
例7 PHP 7.3.0 より前のバージョンでも有効な例
変数を含んでいるヒアドキュメントは、クラスのプロパティの初期化に用いることはできません。 ヒアドキュメントは二重引用符を使用しませんが、 二重引用符で括られた文字列と全く同様に動作します。 これはつまり、引用符をエスケープする必要はないが、 上記のリストにあるエスケープされたコードは同様に使用できるということです。 変数は展開されますが、文字列の場合と同様に ヒアドキュメントの内部で複雑な変数を表わす場合には注意が必要です。 例8 ヒアドキュメントで文字列を括る例
上の例の出力は以下となります。 My name is "MyName". I am printing some Foo. Now, I am printing some Bar2. This should print a capital 'A': A ヒアドキュメント構文を用いて、 関数の引数にデータを渡すこともできます。 例9 ヒアドキュメントを引数に使用する例
static変数やクラスのプロパティ/定数は、 ヒアドキュメント構文で初期化することができます。 例10 ヒアドキュメントを用いた静的な値の初期化
ヒアドキュメントの宣言をダブルクォートで囲むこともできます。 例11 ヒアドキュメントでのダブルクォート
Nowdoc
Nowdoc はヒアドキュメントと似ていますが、
ヒアドキュメントがダブルクォートで囲んだ文字列として扱われるのに対して、
Nowdoc はシングルクォートで囲んだ文字列として扱われます。
Nowdoc の使用方法はヒアドキュメントとほぼ同じですが、
その中身について 文字列の補間処理を行いません。
PHP のコードや大量のテキストを埋め込む際に、
エスケープが不要になるので便利です。この機能は、SGML の
Nowdoc の書き方は、ヒアドキュメントと同じように
例12 Nowdoc による文字列のクォートの例
上の例の出力は以下となります。 Example of string spanning multiple lines using nowdoc syntax. Backslashes are always treated literally, e.g. \\ and \'. 例13 変数がある場合の、Nowdoc による文字列のクォートの例
上の例の出力は以下となります。 My name is "$name". I am printing some $foo->foo. Now, I am printing some {$foo->bar[1]}. This should not print a capital 'A': \x41 例14 静的なデータの例
文字列の補間処理文字列が二重引用符で括られるかヒアドキュメントで指定された場合、 その中の変数は置き換えられます。 構文の型には、単純な構文と 高度な 構文の 2 種類があります。単純な構文は、最も一般的で便利です。 この構文では、変数や配列の値、オブジェクトのプロパティを、 簡単に文字列に埋め込むことができます。 単純な構文
ドル記号 (
上の例の出力は以下となります。 He drank some apple juice. 形式的には、文字列の変数の置き換えの文法は下記のようになります: string-variable:: variable-name (offset-or-property)? | ${ expression } offset-or-property:: offset-in-string | property-in-string offset-in-string:: [ name ] | [ variable-name ] | [ integer-literal ] property-in-string:: -> name variable-name:: $ name name:: [a-zA-Z_\x80-\xff][a-zA-Z0-9_\x80-\xff]* 警告
上の例の PHP 8.2 での出力は、このようになります。: Deprecated: Using ${var} in strings is deprecated, use {$var} instead in file on line 6 Deprecated: Using ${expr} (variable variables) in strings is deprecated, use {${expr}} instead in file on line 9 string(3) "foo" string(3) "bar" 上の例の出力は以下となります。 string(3) "foo" string(3) "bar"
例15 配列の最初の次元やプロパティの値を補間させる
上の例の出力は以下となります。 He drank some apple juice. He drank some orange juice. He drank some purple juice. Object value: string.
PHP 7.1.0 以降では、負の 数値インデックスもサポートされています 例16 負の数値インデックス
上の例の出力は以下となります。 The character at index -2 is n. Changing the character at index -3 to o gives strong. さらに複雑な処理は、 高度な 記法を使う必要があります。 高度な (波括弧) 記法高度な波括弧を使った記法を使うと、 任意のアクセス方法で 変数 の補間を行うことができます。
任意のスカラー変数や、配列の要素、オブジェクトのプロパティ
(static かそうでないかは問いません)
の文字列表現を、この記法に含めることができます。
式は文字列の外部に現れるものと同じやり方で書くことができ、
文字列への文字単位のアクセスと修正$str[42] のように、 角括弧を使用してゼロから始まるオフセットを指定すると、 文字列内の任意の文字にアクセスし、修正することが可能です。 つまり、文字列を文字の配列として考えるわけです。 複数の文字を取り出したり変更したりしたいときは、関数 substr および substr_replace が使えます。
警告
範囲外のオフセットに書き込んだ場合は、その地点まで空白文字で埋められます。
整数型以外の型は整数型に変換されます。
無効なオフセット形式を指定した場合は 警告
内部的には、PHP の文字列はバイト配列です。 そのため、角括弧を使った配列形式での文字列へのアクセスは、 マルチバイト対応ではありません。この方法は、 ISO-8859-1 のようなシングルバイトエンコーディングの文字列に対してだけしか使えません。
例17 文字列の例
文字列のオフセットは整数あるいは整数と見なせる文字列に限られます。 それ以外の場合は警告が発生します。 例18 不正な文字列のオフセットの例
上の例の出力は以下となります。 string(1) "b" bool(true) Warning: Illegal string offset '1.0' in /tmp/t.php on line 7 string(1) "b" bool(false) Warning: Illegal string offset 'x' in /tmp/t.php on line 9 string(1) "a" bool(false) string(1) "b" bool(false)
便利な関数および演算子文字列は、'.' (ドット) 結合演算子で結合することが可能です。'+' (加算) 演算子はこの例では出てこないことに注意してください。詳細については 文字列演算子 を参照ください。 文字列の修正を行う場合には、便利な関数がたくさん用意されています。 一般的な関数については、文字列関数の節 を参照ください。高度な検索/置換を行う関数については Perl 互換の正規表現関数 を参照ください。 URL 文字列用関数や文字列の暗号化/ 復号用の関数 (Sodium および Hash) もあります。 最後に、探しているものがまだ見付からない場合には、 文字型の関数も参照ください。 文字列への変換
bool の
int (整数) や浮動小数点数 (float) は
その数値の数字として文字列に変換されます (指数の表記や浮動小数点数を含めて)。
浮動小数点数は、指数表記
(
配列は常に object を string へ変換するには、 マジック・メソッド __toString を使用してください。
リソースは常に
以上に述べたように、配列、オブジェクト、リソースをプリントアウトしても その値に関する有益な情報を得られるわけではありません。 デバッグのために値を出力するのによりよい方法が知りたければ、 print_r や var_dump を参照ください。 PHP 変数を恒久的に保存するための文字列に変換することもできます。 この方法はシリアライゼーションと呼ばれ、 serialize 関数によって実現できます。 文字列型の詳細
PHP における文字列型は、バイトの配列と整数値 (バッファ長) で実装されています。
バイト列を文字列に変換する方法については何の情報も持っておらず、完全にプログラマ任せとなっています。
文字列を構成する値には何の制限もありません。特に気をつけるべきなのは、
値 PHP の文字列型の正体を知ってしまえば、なぜ PHP には「バイト型」が存在しないのかもわかります。 つまり、文字列型がその役割を受け持っているのです。テキスト以外のデータ、 たとえばネットワークソケットから読み込んだ任意のデータを返す関数も、 文字列で値を返します。
PHP が文字列に対して特定のエンコーディングを強制しないのなら、
いったいどのようにして文字列リテラルをエンコードしているのでしょう?
たとえば、文字列 もちろん、利便性を考慮すれば、テキストを操作する関数が文字列のエンコードを扱う際に 何らかの前提に基づかざるを得ないこともあります。 残念ながら、PHP の各関数が文字列のエンコーディングを判断する方法はまったく統一されていません。
結局、Unicode を使うプログラムをきちんと書くには、 うまく動かない関数を使わないよう注意するしかないということです。 特にデータを破壊してしまう可能性のある関数の使用は避け、 きちんと動作する関数を使うようにしましょう。 intl や mbstring の関数を選択するとよいでしょう。 しかし、Unicode をまともに扱える関数を使うというのは単なる始まりに過ぎません。 たとえ関数側で Unicode を扱う機能があったとしても、 Unicode の仕様に関する知識は不可欠です。 たとえば、世の中には大文字と小文字しか存在しないという思い込みで作ったプログラムは、 うまく動かない可能性があります。 |