「Python」の版間の差分

2017年10月24日 (火) 23:54時点における最新版

かなり忘れつつある Python について。

参考リンク

Python 2.5 ドキュメント - 19th September, 2006
Python 講習会資料 ― 古いけど、まとまっていて見やすい。

覚え書き

グローバル変数など、外側のスコープにある変数は読み出し専用となる。global 文を使えば代入できる。
一定時間待ちを入れる場合は、import time して time.sleep(n) を使う。
gzip コマンドで圧縮したデータを zlib モジュールでは展開できない (ヘッダが異なるため)。gzip + StringIO モジュールを使って回避する。
対話モードでは、最後に表示された結果は変数 _ に代入される。
print の末尾にコンマを入れると、改行されない。print "hoge",
一つの要素のタプルは、値の後ろにコンマを付ける。("hoge",)
複数の比較演算子を a < b == c のように書ける素晴らしい言語。
print >> sys.stderr, ... で標準エラーに出力

文字列

シングルクォートとダブルクオートに違いはない。
- エスケープシーケンスを無視する場合は raw 文字列を使う。r"raw 文字列\n"
三重クォート """ あるいは ''' は改行をそのまま含めることができる。
連結は + 演算子を用いる。
- 文字列リテラルは、列記で連結可能。"ho" "ge" → "hoge"
len() 組み込み関数でバイト数を得る。
- マルチバイトを考慮した文字数は len(str.decode("UTF-8")) で得ることができる。
in で包含判定ができる
int(str) で整数に変換。第 2 引き数で基数指定可能。

スライス

文字の間に添字を置くとわかりやすい。

s = "H e l l o"
    0 1 2 3 4 5
  - 5 4 3 2 1   ← ここは -0 でないことに注意!! (0 = -0 のため)

s[1]   → 'e'
s[:3]  → 'Hel' # 先頭 3 文字
s[3:]  → 'lo'
s[-4]  → 'e'
s[-3:] → 'llo' # 末尾 3 文字
s[:-1] → 'Hell' # 最後の 1 文字を削る (改行削りに有用)
s[:]   → コピーを作る

バージョンによる違い

	RHEL5	RHEL6	RHEL7
Python	2.4.3	2.6.6	2.7.5
with 文	x	o	o
条件演算 (三項演算子)	x	o	o
リスト内包表記	o	o	o
辞書内包表記	x	x	o
ジェネレータ式	o	o	o
enumerate 関数の start 引数	x	o	o
try... except... finally	x	o	o
sort/sorted の key 引数	o	o	o
@property デコレータ	o	o	o
property オブジェクトの getter, setter, deleter 関数	x	o	o
all, any 関数	x	o	o
bin 関数	x	x	o

※RHEL4 は 2.3.4、RHEL3 は 2.2.3。

その他

リストを N 分割する

ちょうど N 個に分割するわけではなく、最大で N 個なので注意。

def split_list(list, n):
    l = len(list)
    size = l / n + (l % n > 0)
    return [ list[i:i+size] for i in range(0, l, size) ]

こんな感じで分割したリストのリストになる。

>>> l = [1,2,3,4,5,7,8,9,10]
>>> split_list(l, 2)
[[1, 2, 3, 4, 5], [7, 8, 9, 10]]
>>> split_list(l, 3)
[[1, 2, 3], [4, 5, 7], [8, 9, 10]]
>>> split_list(l, 4)
[[1, 2, 3], [4, 5, 7], [8, 9, 10]]
>>> split_list(l, 5)
[[1, 2], [3, 4], [5, 7], [8, 9], [10]]

モジュールに定義された名前のリスト

dir 関数を使う。(忘れやすい)

>>> dir()
['__builtins__', '__doc__', '__name__', '__package__']
>>> import time
>>> dir()
['__builtins__', '__doc__', '__name__', '__package__', 'time']
>>> dir(time)
['__doc__', '__file__', '__name__', '__package__', 'accept2dyear', 'altzone', 'asctime', 'clock',
'ctime', 'daylight', 'gmtime', 'localtime', 'mktime', 'sleep', 'strftime', 'strptime',
'struct_time', 'time', 'timezone', 'tzname', 'tzset']

socket の setsockopt() を使う

SO_KEEPALIVE の場合

import socket
s = socket.socket()
s.setsockopt(socket.SOL_SOCKET, socket.SO_KEEPALIVE, 1)

SO_LINGER の場合

import socket
import struct
s = socket.socket()
s.setsockopt(socket.SOL_SOCKET, socket.SO_LINGER, struct.pack('ii', 1, 30))

テンプレート

awk 風 Python スクリプトテンプレート

テキスト処理を何でもかんでも簡単な awk で済ませちゃうクセがついてしまったので、自分に Python を使うように仕向けるための awk 風テンプレート。

FS, NR, FILENAME, FNR, NF, s[0], s[1..NF] が利用可能。

#!/usr/bin/env python
import sys

if len(sys.argv) == 1:
    files = [ sys.stdin ]
else:
    files = [ open(f) for f in sys.argv[1:] ]

### BEGIN {
FS = None

### }

NR = 0
for file in files:
    FNR = 0; FILENAME = file.name
    for line in file:
        NR += 1; FNR += 1
        s = line.split(FS)
        s[0:0] = [ line[:-1] ]
        NF = len(s)
        # print NR, FILENAME, FNR, NF, s
        ### {

        ### }

### END {

### }

ファイルか標準入力から読む

ファイルが指定されれば、それらをすべて処理し、指定されなければ標準入力から読む。

import sys

if len(sys.argv) == 1:
    files = [ sys.stdin ]
else:
    files = [ open(f) for f in sys.argv[1:] ]

for file in files:
    ...

fileinput モジュールというのがあった…

getopt

どの言語でもこいつだけはテンプレート化する必要がある。。

import sys
import getopt

def usage(exit_code):
    out = (exit_code and sys.stderr) or sys.stdout
    print >> out, 'Usage: %s [-a] [-b str]' % sys.argv[0]
    sys.exit(exit_code)

try:
    opts, args = getopt.getopt(sys.argv[1:], 'ab:h')
except getopt.GetoptError:
    usage(1)

(opt_a, opt_b) = (False, None) # defaults
for (opt, val) in opts:
    if opt == '-a':
        opt_a = True
    elif opt == '-b':
        opt_b = val
    elif opt == '-h':
         usage(0)
    else:
         usage(1)

for arg in args: # remainder
    ...