スキップしてメイン コンテンツに移動

多分週刊チラシの裏 (Oct 19, 2020 - Feb 26, 2021)

週刊とは言ったが毎週刊とは言ってないという言い訳。

C++ のコンパイルを高速化する小技

ビルドシステムやツールを変更せずともコーディングだけで改善できるコンパイル時間短縮テクニック。

  • #include を減らす
  • インライン化を明示的に避ける
  • 関数オーバーロードの可視性を制限する
  • 公開シンボルを減らす

の 4 本。

歯医者で歯を治したら記憶能力を失った話

歯医者で簡単な治療を受けた日から後、記憶が 90 分しか保持できなくなった英国の軍人の話。まるで「博士の愛した数式」だが実話である。

DRPK で売られていた Sim City っぽいゲームのリバースエンジニアリング

平壌市内のアプリストア (物理) で売られていた Sim City 風ゲームがインストールに失敗してライセンス認証で止まってしまったのでなんとか動かせないものかとリバースエンジニアリングしてみた話。

日本にあっては DPRK のデジタル事情というと 3G セルラーが現役とか国内 Web サイトのリストがポスター一枚に収まるとか何故かコンピュータ将棋の古豪とかの断片的な情報が伝え聞かれる程度だが、近頃は Android タブレットでゲームなどもできるらしい。 国内のインフラ及びエコシステム事情に合わせて元々フリーミアム + アプリ内課金モデルだったものが買い切り 5,000 KPW (< 1 USD) になっているなど、我々が失った自由が我々よりも不自由な (はずだと我々が信じている) 国に残存しているのは皮肉だろうか。

typosquatting は単なる typo じゃ済まない

typo を狙って人気のあるドメインやソフトウェアに類似した名前をつける手法 (typosquatting) は人を辟易させるのみならずセキュリティの脅威である。 IQT が 2017 年から 2020 年にかけて Python ライブラリの中央リポジトリである PyPI において行った調査で、メジャーなライブラリに名前を似せたマルウェアが 40 個確認されたとのこと。

その内 16 個が単純なスペルミス狙い (e.g., “urlib3” vs. “urllib3”) で、26 個は正当なパッケージと混同するような名前 (e.g., “nmap-python” vs. “python-nmap”) だった (2個のパッケージは両方の特徴を併せ持つため重複して計数されていることに注意。)

セマンティック Web に何が起きたのか

概念とその関係をメタデータとして記述することで機械可読なグラフデータベースを Web に加えようとしたセマンティック Web の当初の目論見が如何にして失敗し、Linked Open Data として再出発し、Web 検索・メディア・E コマースの各分野でどのように受容されてきたかのまとめ。

私見だがセマンティック Web が広まらなかったのは大部分のユーザにとって Web は出版メディアであってデータベースではなかったためだと思う。

Dr. Mario 64 に GNU gzip の inflate 実装が使われている模様

プロプライエタリな Nintendo 64 用ゲームである Dr. Mario 64 の流出したソースコードから GNU による gzip 実装の一部が見つかったとのこと。当然ながら GNU gzip は GPL ライセンスで配布されているソフトウェアである。

ただし inflate.c は原著者によってパブリックドメインと宣言されたコードが元になっているため、厳密に GPL の侵害となるかは微妙な問題である。

Linux 5.10 で 2038 年問題が 2486 年問題に緩和される

time_t を始めとする日時型のビット幅に起因する 2038 年問題 (a.k.a. Y2K38) への対応が Linux カーネルに取り込まれ始めたという話題。タイトルがフザけているのは The Reg の平常運行である。 Linux で標準的に使われているファイルシステムである XFS にパッチが取り込まれ、ディスク上のタイムスタンプにより多くのビット幅が割り当てられるようになる。

この変更によって問題の 2038 年まで 17 年近い移行猶予が持てることになる。なお「その間の面倒を見られる十分な数の人類が COVID-19 を生き延びたとしての話」とのこと。

合衆国とアメリカ原住民との条約のデジタルスキャンが公開された

米国立公文書館と Museum of Indian Arts and Culture の共同事業として、アメリカ原住民らと合衆国政府の間で交わされた 400 近い条約が初めてスキャンされオンラインで閲覧可能になった。

これらはかつて結ばれ、そして破られた約束というばかりでなく、土地や資源に関する対政府あるいは部族間の係争について今日でも重要な役割を担っているとのこと。

Growl 引退

Mac OS X の時代から使われてきた通知フレームワーク Growl の開発終了が宣言された。

2012 年に OS X Mountain Lion が Notication Center を導入して以来のアプリケーション開発者の流出と動作環境の ARM アーキテクチャへの移行、そして Growl 自身の今後の改良方針の欠如が理由とのこと。

火星じゃなくて金星を目指すべき理由

億万長者の白人男どもが火星を目指せとそそのかすのはまやかしで、金星の方が有望だという主張。

金星の方が若干距離が近いため到達に必要な時間とエネルギィが省ける上、地球と同程度の重力を持つため骨密度低下などの低重力環境における疾病のリスクが抑えられ、何より大気と地磁気を持つので宇宙放射線への防御がはじめから備わっているなど多くの優位性を根拠にしている。

ところで、当然ながら (現在の) 金星の地表は極端な高温・高圧環境なので生物は生存できない。ではどうするかというと電離層の下、雲の中に呼吸可能な大気を充填した風船を浮かべてその中に都市を建設するのだとか。

文字通り雲を掴むような話だが、それでも火星で放射線を避けるために地下深く、解決の見込みのない低重力環境に暮らすのと比べれば有望かも知れない。

差別的な用語の置き換えを推進する Inclusive Naming Initiative が発足

BLM ムーヴメントに呼応して “blacklist” / “whitelist” とか “master” / “slave” といった差別を想起させたり不要に攻撃的な用語を考え直す風潮が高まっているが、Cloud Native Computing Foundation を中心として大手テック企業も参加した Inclusive Naming Initiavie が発足した。

ロードマップ上では 2021 年第一四半期に代替用語とベストプラクティス、ツールや文書などを作成することを直近の目標としている。現在公開されているリソースはまだ途上かつ少量だが、有害な言葉の評価フレームワークなど既にある程度策定が進んでいるものもある。ちなみにトロルの対処法にも言及されているが、これは実際に難癖をつけてきたアシカ共によって実証済とのこと。

何故イタリア人は 11 時以降にカプチーノを飲まないのか

答え: イタリア人の多くは乳糖不耐症 (あるいはより広い意味の Lactose Malabsorber) なので日に 2 杯も飲めないから。

アジアの辺境に暮らしているとヨーロッパ人種は一様にミルクを飲めると思いがちだが、暑い地中海沿岸でのミルクの利用はチーズなど発酵食品が主だったため乳糖不耐症の人もざらにいるとのこと。

Microsoft FrontPage: The Good, The Bad, and The Ugly

タイトルだけイタリアつながり。かつて Microsoft Office の一員であった Web オーサリングソフトウェアである FrontPage の思い出。

ActiveX や ASP といった固有技術のサポートを通して Microsoft のロックイン戦略の走狗となったことが思い出されるが、それはそれとして非熟練者がプラットフォームに依存することなく「ホームページ」を制作できた、翻って今日の Web 制作はどうか。

「積読」の紹介

「積読 (tsundoku)」という言葉を英語圏に紹介する 2018 年の記事だが、その語の初出が少なくとも 19 世紀末に遡れること、Bibliomania との違い (Bibliomania は文献の収集自体に関心があるが Tsundoku は読む意思のある文献を読まない結果としての意図的でない収集) など日本語を母語とする我々も知らない蘊蓄が面白い。

多様性を描いた Nike の広告が日本で炎上

日本に住むマイノリティの実体験を基にした広告が「日本に差別があることを認識させる」という理解し難い「批判」に晒され炎上したという記事。

過去にあった同様の事例としてフランスの高級品ブランド Dior が「中国の領土から台湾を除いた地図を広告に使った」かどで中国で炎上した例が挙げられている。

環境意識を喚起する活動が日本で炎上

モデルであり環境省の「プラごみゼロアンバサダー」なる肩書を持つトラウデン直美氏が、首相官邸にて行われた環境フォーラムで提唱した「買い物をする際、店員に『環境に配慮した商品ですか』と尋ねる」行為が「悪質なクレーム」だという理解し難い「批判」に晒され炎上したという記事。

斯様な馬鹿げた曲解も発言者が若い女性であれば実際罷り通ることで、同様に激烈な中傷と脅迫に晒された環境保護活動家のグレタ・トゥンベリ氏のことも思い起こされる。

1 MB クラブ

アセットと JavaScript で膨れ上がった今日の Web において「クライアントがダウンロードするリソースが 1MB 未満である」サイトのリスト。なお Hacker News でバズった結果サイトの登録依頼が殺到しており一時受付停止中 (as of Dec 18) との由。

ちなみに Web の総本山である W3C のサイトは 870.5 KB、味気なさすぎるデザインで有名な Craigslist も 734.4 KB と 1 MB クラブの中ではあまり奮わない。

一週間でなれる!スパコンプログラマ

著者は慶応大学の渡辺宙志准教授 (Twitter のロボ太 (@kaityo256) の人) の手になる現代の超並列型スーパーコンピュータ向けの分散プログラミング入門 (日本語)。

MPI を使ったプロセス並列とか分割した上での各ノード上での SIMD 命令とかの話で、「入門」と書いてあるが実際に入門書である、念の為。

コメント

このブログの人気の投稿

京大テキストコーパスのパーサを書いた

要旨 CaboCha やなんかの出力形式であるところの京大テキストコーパス形式のパーサモジュールを Perl で書いたので紹介します。 Github Tarball on Github Ppages これを使うと例えば CaboCha の出力した係り受け関係を Perl のオブジェクトグラフとして取得できます。 使用例 単なる文節区切りの例。 #!/usr/bin/env perl use v5.18; use utf8; use IPC::Open3; use Parse::KyotoUniversityTextCorpus; use Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab; use Symbol qw//; my ($in, $out, $err); my $pid; BEGIN { ($in, $out, $err) = (Symbol::gensym, Symbol::gensym, Symbol::gensym); $pid = open3($in, $out, $err, cabocha => '-f1'); } END { close $out; close $err; waitpid $pid => 0 if defined $pid; } binmode STDOUT, ':encoding(utf8)'; binmode $in, ':encoding(utf8)'; binmode $out, ':encoding(utf8)'; my $parser = Parse::KyotoUniversityTextCorpus->new( morpheme_parser => Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab->new, ); say $in '星から出るのに、その子は渡り鳥を使ったんだと思う。'; say $in '出る日の朝、自分の星の片付けをした。'; close $in; my $sentence

C の時間操作関数は tm 構造体の BSD 拡張を無視するという話

久しぶりに C++ (as better C) で真面目なプログラムを書いていて引っかかったので備忘録。 「拡張なんだから標準関数の挙動に影響するわけねえだろ」という常識人は読む必要はない。 要旨 time_t の表現は環境依存 サポートしている時刻は UTC とプロセスグローバルなシステム時刻 (local time) のみで、任意のタイムゾーン間の時刻変換を行う標準的な方法はない BSD / GNU libc は tm 構造体にタイムゾーン情報を含むが、tm -> time_t の変換 ( timegm / mktime ) においてその情報は無視される 事前知識 C 標準ライブラリにおいて時刻の操作に関係するものは time.h (C++ では ctime) ヘッダに定義されている。ここで時刻を表現するデータ型は2つある: time_t と tm である。time_t が第一義的な型であり、それを人間が扱い易いように分解した副次的な構造体が tm という関係になっている。なので標準ライブラリには現在時刻を time_t として取得する関数 ( time_t time(time_t *) ) が先ずあり、そこから time_t と tm を相互に変換する関数が定義されている。 ここで time_t の定義は処理系依存である。C / C++ 標準はそれが算術型であることを求めているのみで (C11 からは実数型に厳格化された)、その実体は任意である。POSIX においては UNIX epoch (1970-01-01T00:00:00Z) からのうるう秒を除いた経過秒数であることが保証されており Linux や BSD の子孫も同様だが、この事実に依存するのは移植性のある方法ではない。 一方で tm は構造体であり、最低限必要なデータメンバが規定されている: int tm_year : 1900 年からの年数 int tm_mon : 月 (0-based; 即ち [0, 11]) int tm_mday : 月初からの日数 (1-based) int tm_hour : 時 (Military clock; 即ち [0, 23]) int tm_min : 分 int tm_sec : 秒 (うるう秒を含み得るので [0

救急外来にかかったときの記録

子どもの頃にかかった記憶はあるが自分で行ったことはなかったのでメモしておく。 先日怪我をした。より具体的に云うとランニング中に転倒し顎を地面に叩きつけた。深夜の12時ごろの話である。 その時点ては両手の擦傷が痛いとか下顎の間接が痛いとか奥歯のセラミックが割れなくて幸いだったといった程度だが、マスクを外して見るとなにやら下部に血がついている。 顎にも擦傷があるのかとうんざりしながら歩いて帰り、血の滲んだマスクを捨てて傷口を洗おうとしたところで皮膚が割けて肉が見えているのに気付いた。 一瞬顔が青くなったが単身なので倒れるわけにはいかない。幸い血は固まっていてそれほど出血していないし、先程まで運動していたからかあまり痛みもない。 この時点で明白な選択肢は3つあった。即ち: 救急車を呼ぶ 自力で病院へ行き救急外来を受診する 応急処置して朝になったら近場の医院を受診する である。まず 3 は精神的に無理だと悟った。血も完全には止まっていないし、痛みだしたら冷静に行動できなくなるだろう。 1 はいつでも可能だったが、意識明瞭で移動にも支障がない状態では憚られた。救急車が受け入れ先病院を探すのにも時間がかかると聞く。 結局とりあえず 1 をバックアップ案とし、2 の自分で連絡して病院へ向かうことにした。まずは病院探しである。このときだいたい 00:30 AM。 最初に連絡したのは最寄りの都立病院の ER だった。ここならタクシーで10分もかからない、のだが、なんと ER が現在休止しているとの回答だった。そんなことがあるのかと驚愕したがどうしようもない。 近場に形成外科の救急外来の開いている病院はないか尋ねたところ 消防庁の相談センター の電話番号を案内された。 ここで4つの病院を紹介された。余談だが相談の対応は人間だが番号の案内は自動音声に切り替わるので録音の用意をした方が良い (一応2回くり返してくれる。) いずれも若干遠くタクシーで2、30分かかるが仕方がない。最初に連絡した最寄りの病院はその日形成外科の当直医師がいなかった。二件目でトリアージの質問をされ、受け入れ可能とのことだったので受診先が決定。このとき 00:45 AM。 診察時に脱ぎ易い服に着替え (このときまでランニングウェアだった)、健康保険証を持って病院へ向かう。ガーゼがないのでマス

js_of_ocaml の使い方

js_of_ocaml (jsoo) は Ocsigen が提供しているコンパイラである。その名の通り OCaml バイトコードから JavaScript コードを生成する。 これを使うことで OCaml で書いたプログラムを Web ブラウザや node.js で実行することができる。 インストール 単に OPAM を使えば良い: $ opam install js_of_ocaml js_of_ocaml-ocamlbuild js_of_ocaml-ppx バージョン 3.0 から OPAM パッケージが分割されたので、必要なライブラリやプリプロセッサは個別にインストールする必要がある。 とりあえず使うだけなら js_of_ocaml と js_of_ocaml-ppx の二つで十分。後述するように OCamlBuild でアプリケーションをビルドするなら js_of_ocaml-ocamlbuild も入れると良い。 これで js_of_ocaml コマンドがインストールされ、OCamlFind に js_of_ocaml 及びサブパッケージが登録される。 コンパイルの仕方 以下ソースファイル名は app.ml とし、ワーキングディレクトリにあるものとする。 手動でやる場合 一番安直な方法は、直接 js_of_ocaml コマンドを実行することである: $ # バイトコードにコンパイルする。js_of_ocaml.ppx は JavaScript オブジェクトの作成や操作の構文糖衣を使う場合に必要 $ ocamlfind ocamlc -package js_of_ocaml,js_of_ocaml.ppx -linkpkg -o app.byte app.ml $ # 得られたバイトコードを JavaScript にコンパイルする $ js_of_ocaml -o app.js app.byte OCamlBuild を使う場合 OCamlBuild を使う場合、.js 用のビルドルールを定義したディスパッチャが付属しているので myocamlbuild.ml でこれを使う: let () = Ocamlbuild_plugin . dispatch Ocamlbuild_js_of_ocaml . dispatcher $ # app.ml ->

開発環境の構築に asdf が便利なので anyenv から移行した

プロジェクト毎に異なるバージョンの言語処理系やツールを管理するために、pyenv や nodenv など *env の利用はほとんど必須となっている。 これらはほとんど一貫したコマンド体系を提供しており、同じ要領で様々な環境構築ができる非常に便利なソフトウェアだが、それを使うことで別の問題が出てくる: *env 自身の管理である。 無数の *env をインストールし、シェルを設定し、場合によりプラグインを導入し、アップデートに追従するのは非常に面倒な作業だ。 幸いなことにこれをワンストップで解決してくれるソリューションとして anyenv がある。これは各種 *env のパッケージマネージャというべきもので、一度 anyenv をインストールすれば複数の *env を簡単にインストールして利用できる。さらに anyenv-update プラグインを導入すればアップデートまでコマンド一発で完了する。素晴らしい。 そういうわけでもう長いこと anyenv を使ってきた。それで十分だった。 ——のだが、 ここにもう一つ、対抗馬となるツールがある。 asdf である。anyenv に対する asdf の優位性は大きく2つある: 一貫性と多様性だ。 一貫性 “Manage multiple runtime versions with a single CLI tool” という触れ込み通り、asdf は様々な言語やツールの管理について一貫したインタフェースを提供している。対して anyenv は *env をインストールするのみで、各 *env はそれぞれ個別のインタフェースを持っている。 基本的なコマンド体系は元祖である rbenv から大きく外れないにしても、例えば jenv のように単体で処理系を導入する機能を持たないものもある。それらの差異はユーザが把握し対応する必要がある。 多様性 asdf はプラグインシステムを持っている。というより asdf 本体はインタフェースを規定するだけで、環境構築の実務はすべてプラグイン任せである。 そのプラグインの数は本稿を書いている時点でおよそ 300 を数える。これは言語処理系ばかりでなく jq などのユーティリティや MySQL のようなミドルウェアも含むが、いずれにしても膨大なツールが asdf を使えば