スキップしてメイン コンテンツに移動

多分週刊チラシの裏 (Oct 19, 2020 - Feb 26, 2021)

週刊とは言ったが毎週刊とは言ってないという言い訳。

C++ のコンパイルを高速化する小技

ビルドシステムやツールを変更せずともコーディングだけで改善できるコンパイル時間短縮テクニック。

  • #include を減らす
  • インライン化を明示的に避ける
  • 関数オーバーロードの可視性を制限する
  • 公開シンボルを減らす

の 4 本。

歯医者で歯を治したら記憶能力を失った話

歯医者で簡単な治療を受けた日から後、記憶が 90 分しか保持できなくなった英国の軍人の話。まるで「博士の愛した数式」だが実話である。

DRPK で売られていた Sim City っぽいゲームのリバースエンジニアリング

平壌市内のアプリストア (物理) で売られていた Sim City 風ゲームがインストールに失敗してライセンス認証で止まってしまったのでなんとか動かせないものかとリバースエンジニアリングしてみた話。

日本にあっては DPRK のデジタル事情というと 3G セルラーが現役とか国内 Web サイトのリストがポスター一枚に収まるとか何故かコンピュータ将棋の古豪とかの断片的な情報が伝え聞かれる程度だが、近頃は Android タブレットでゲームなどもできるらしい。 国内のインフラ及びエコシステム事情に合わせて元々フリーミアム + アプリ内課金モデルだったものが買い切り 5,000 KPW (< 1 USD) になっているなど、我々が失った自由が我々よりも不自由な (はずだと我々が信じている) 国に残存しているのは皮肉だろうか。

typosquatting は単なる typo じゃ済まない

typo を狙って人気のあるドメインやソフトウェアに類似した名前をつける手法 (typosquatting) は人を辟易させるのみならずセキュリティの脅威である。 IQT が 2017 年から 2020 年にかけて Python ライブラリの中央リポジトリである PyPI において行った調査で、メジャーなライブラリに名前を似せたマルウェアが 40 個確認されたとのこと。

その内 16 個が単純なスペルミス狙い (e.g., “urlib3” vs. “urllib3”) で、26 個は正当なパッケージと混同するような名前 (e.g., “nmap-python” vs. “python-nmap”) だった (2個のパッケージは両方の特徴を併せ持つため重複して計数されていることに注意。)

セマンティック Web に何が起きたのか

概念とその関係をメタデータとして記述することで機械可読なグラフデータベースを Web に加えようとしたセマンティック Web の当初の目論見が如何にして失敗し、Linked Open Data として再出発し、Web 検索・メディア・E コマースの各分野でどのように受容されてきたかのまとめ。

私見だがセマンティック Web が広まらなかったのは大部分のユーザにとって Web は出版メディアであってデータベースではなかったためだと思う。

Dr. Mario 64 に GNU gzip の inflate 実装が使われている模様

プロプライエタリな Nintendo 64 用ゲームである Dr. Mario 64 の流出したソースコードから GNU による gzip 実装の一部が見つかったとのこと。当然ながら GNU gzip は GPL ライセンスで配布されているソフトウェアである。

ただし inflate.c は原著者によってパブリックドメインと宣言されたコードが元になっているため、厳密に GPL の侵害となるかは微妙な問題である。

Linux 5.10 で 2038 年問題が 2486 年問題に緩和される

time_t を始めとする日時型のビット幅に起因する 2038 年問題 (a.k.a. Y2K38) への対応が Linux カーネルに取り込まれ始めたという話題。タイトルがフザけているのは The Reg の平常運行である。 Linux で標準的に使われているファイルシステムである XFS にパッチが取り込まれ、ディスク上のタイムスタンプにより多くのビット幅が割り当てられるようになる。

この変更によって問題の 2038 年まで 17 年近い移行猶予が持てることになる。なお「その間の面倒を見られる十分な数の人類が COVID-19 を生き延びたとしての話」とのこと。

合衆国とアメリカ原住民との条約のデジタルスキャンが公開された

米国立公文書館と Museum of Indian Arts and Culture の共同事業として、アメリカ原住民らと合衆国政府の間で交わされた 400 近い条約が初めてスキャンされオンラインで閲覧可能になった。

これらはかつて結ばれ、そして破られた約束というばかりでなく、土地や資源に関する対政府あるいは部族間の係争について今日でも重要な役割を担っているとのこと。

Growl 引退

Mac OS X の時代から使われてきた通知フレームワーク Growl の開発終了が宣言された。

2012 年に OS X Mountain Lion が Notication Center を導入して以来のアプリケーション開発者の流出と動作環境の ARM アーキテクチャへの移行、そして Growl 自身の今後の改良方針の欠如が理由とのこと。

火星じゃなくて金星を目指すべき理由

億万長者の白人男どもが火星を目指せとそそのかすのはまやかしで、金星の方が有望だという主張。

金星の方が若干距離が近いため到達に必要な時間とエネルギィが省ける上、地球と同程度の重力を持つため骨密度低下などの低重力環境における疾病のリスクが抑えられ、何より大気と地磁気を持つので宇宙放射線への防御がはじめから備わっているなど多くの優位性を根拠にしている。

ところで、当然ながら (現在の) 金星の地表は極端な高温・高圧環境なので生物は生存できない。ではどうするかというと電離層の下、雲の中に呼吸可能な大気を充填した風船を浮かべてその中に都市を建設するのだとか。

文字通り雲を掴むような話だが、それでも火星で放射線を避けるために地下深く、解決の見込みのない低重力環境に暮らすのと比べれば有望かも知れない。

差別的な用語の置き換えを推進する Inclusive Naming Initiative が発足

BLM ムーヴメントに呼応して “blacklist” / “whitelist” とか “master” / “slave” といった差別を想起させたり不要に攻撃的な用語を考え直す風潮が高まっているが、Cloud Native Computing Foundation を中心として大手テック企業も参加した Inclusive Naming Initiavie が発足した。

ロードマップ上では 2021 年第一四半期に代替用語とベストプラクティス、ツールや文書などを作成することを直近の目標としている。現在公開されているリソースはまだ途上かつ少量だが、有害な言葉の評価フレームワークなど既にある程度策定が進んでいるものもある。ちなみにトロルの対処法にも言及されているが、これは実際に難癖をつけてきたアシカ共によって実証済とのこと。

何故イタリア人は 11 時以降にカプチーノを飲まないのか

答え: イタリア人の多くは乳糖不耐症 (あるいはより広い意味の Lactose Malabsorber) なので日に 2 杯も飲めないから。

アジアの辺境に暮らしているとヨーロッパ人種は一様にミルクを飲めると思いがちだが、暑い地中海沿岸でのミルクの利用はチーズなど発酵食品が主だったため乳糖不耐症の人もざらにいるとのこと。

Microsoft FrontPage: The Good, The Bad, and The Ugly

タイトルだけイタリアつながり。かつて Microsoft Office の一員であった Web オーサリングソフトウェアである FrontPage の思い出。

ActiveX や ASP といった固有技術のサポートを通して Microsoft のロックイン戦略の走狗となったことが思い出されるが、それはそれとして非熟練者がプラットフォームに依存することなく「ホームページ」を制作できた、翻って今日の Web 制作はどうか。

「積読」の紹介

「積読 (tsundoku)」という言葉を英語圏に紹介する 2018 年の記事だが、その語の初出が少なくとも 19 世紀末に遡れること、Bibliomania との違い (Bibliomania は文献の収集自体に関心があるが Tsundoku は読む意思のある文献を読まない結果としての意図的でない収集) など日本語を母語とする我々も知らない蘊蓄が面白い。

多様性を描いた Nike の広告が日本で炎上

日本に住むマイノリティの実体験を基にした広告が「日本に差別があることを認識させる」という理解し難い「批判」に晒され炎上したという記事。

過去にあった同様の事例としてフランスの高級品ブランド Dior が「中国の領土から台湾を除いた地図を広告に使った」かどで中国で炎上した例が挙げられている。

環境意識を喚起する活動が日本で炎上

モデルであり環境省の「プラごみゼロアンバサダー」なる肩書を持つトラウデン直美氏が、首相官邸にて行われた環境フォーラムで提唱した「買い物をする際、店員に『環境に配慮した商品ですか』と尋ねる」行為が「悪質なクレーム」だという理解し難い「批判」に晒され炎上したという記事。

斯様な馬鹿げた曲解も発言者が若い女性であれば実際罷り通ることで、同様に激烈な中傷と脅迫に晒された環境保護活動家のグレタ・トゥンベリ氏のことも思い起こされる。

1 MB クラブ

アセットと JavaScript で膨れ上がった今日の Web において「クライアントがダウンロードするリソースが 1MB 未満である」サイトのリスト。なお Hacker News でバズった結果サイトの登録依頼が殺到しており一時受付停止中 (as of Dec 18) との由。

ちなみに Web の総本山である W3C のサイトは 870.5 KB、味気なさすぎるデザインで有名な Craigslist も 734.4 KB と 1 MB クラブの中ではあまり奮わない。

一週間でなれる!スパコンプログラマ

著者は慶応大学の渡辺宙志准教授 (Twitter のロボ太 (@kaityo256) の人) の手になる現代の超並列型スーパーコンピュータ向けの分散プログラミング入門 (日本語)。

MPI を使ったプロセス並列とか分割した上での各ノード上での SIMD 命令とかの話で、「入門」と書いてあるが実際に入門書である、念の為。

コメント

このブログの人気の投稿

LIBLINEAR 2.41 で One-class SVM が使えるようになったので Perl から触ってみよう

改訂 (Sep 15, 2020): 必要のない手順を含んでいたのでサンプルコードと記述を修正しました。 CPAN に Algorithm::LibLinear 0.22 がリリースされました (しました。) 高速な線形 SVM およびロジスティック回帰による複数の機械学習アルゴリズムを実装したライブラリである LIBLINEAR への Perl バインディングです。 利用している LIBLINEAR のバージョンが LIBLINEAR 2.30 から LIBLINEAR 2.41 に上がったことで新しいソルバが追加され、One-class SVM (OC-SVM) による一値分類が利用可能になっています (しました。) OC-SVM って何 一値分類を SVM でやること。 一値分類って何 ある値が学習したクラスに含まれるか否かを決定する問題。 HBO の「シリコンバレー」に出てきた「ホットドッグ」と「ホットドッグ以外」を識別するアプリが典型。「ホットドッグ以外」の方は犬でも神でも一つの指輪でも何でも含まれるのがミソ。 二値分類の場合正反両者のデータを集める必要があるのに対して、一値分類の学習器は正例データのみしか要求しない (ものが多い。) 主な用途は外れ値検出で、もちろんホットドッグやホットドッグ様のものを検出したりもできる。 使い方 手順自体は他の二値ないし多値分類問題と同じです。つまり、 訓練パラメータを決めて 訓練データセットで訓練して テストデータセットで確度を検証して 十分良くなったらモデルを保存する といういつもの流れ。 訓練パラメータ use 5.032 ; use Algorithm::LibLinear ; my $learner = Algorithm::LibLinear ->new( epsilon => 0.01 , nu => 0.75 , solver => ' ONECLASS_SVM ' , ); solver => 'ONECLASS_SVM' が一値分類用のソルバです。LIBLINEAR の train コマンドで言うところの -s 21 。 OC-SVM の良いところは (ハイパー)...

Perl 5 to 6 - コンテキスト

2011-02-27: コメント欄で既に改訂された仕様の指摘がありました ので一部補足しました。 id:uasi に感謝します。 これはMoritz Lenz氏のWebサイト Perlgeek.de で公開されているブログ記事 "Perl 5 to 6" Lesson 06 - Contexts の日本語訳です。 原文は Creative Commons Attribution 3.0 Germany に基づいて公開されています。 本エントリには Creative Commons Attribution 3.0 Unported を適用します。 Original text: Copyright© 2008-2010 Moritz Lenz Japanese translation: Copyright© 2011 SATOH Koichi NAME "Perl 5 to 6" Lesson 06 - コンテキスト SYNOPSIS my @a = <a b c> my $x = @a; say $x[2]; # c say (~2).WHAT # Str() say +@a; # 3 if @a < 10 { say "short array"; } DESCRIPTION 次のように書いたとき、 $x = @a Perl5では $x は @a より少ない情報—— @a の要素数だけ——しか持ちません。 すべての情報を保存しておくためには明示的にリファレンスを取る必要があります: $x = \@a Perl6ではこれらは反対になります: デフォルトでは何も失うことなく、スカラ変数は配列を単に格納します。 これは一般要素コンテキスト(Perl5で scalar と呼ばれていたもの)及びより特化された数値、整数、文字列コンテキストの導入によって可能となりました。無効コンテキストとリストコンテキストは変更されていません。 特別な構文でコンテキストを強制できます。 構文 コンテキスト ~stuff 文字列 ?stuff 真理値 +stuff ...

Perl の新 class 構文を使ってみる

Perl 5 のオブジェクト指向機能は基本的には Python の影響を受けたものだが、データを名前空間 (package) に bless する機構だけで Perl 4 以来の名前空間とサブルーチンをそのままクラスとメソッドに転換し第一級のオブジェクト指向システムとした言語設計は驚嘆に価する。 実際この言語のオブジェクトシステムは動的型付言語のオブジェクト指向プログラミングに要求されるおよそあらゆる機能を暗にサポートしており、CPAN には Moose を筆頭とした屋下屋オブジェクトシステムが複数存在しているがその多くは Pure Perl ライブラリである。つまり「やろうと思えば全部手書きで実現できる」わけである。 そういうわけで Perl のオブジェクト指向プログラミングサポートは機能面では (静的型検査の不在という現代的には極めて重大な欠如を除けば) 申し分ないのだが、しかし Moose その他の存在が示しているように一つ明らかな欠点がある。記述の冗長さだ。 コンストラクタを含むあらゆるメソッドは第一引数としてレシーバを受ける単なるサブルーチンとして明示的に書く必要があるし、オブジェクトのインスタンス変数 (a.k.a. プロパティ / データメンバ) は bless されたデータに直接的ないし間接的に プログラマ定義の方法 で格納されるためアクセス手段は実装依存である。これはカプセル化の観点からは望ましい性質だが、他者の書いたクラスを継承するときに問題となる。ある日データ表現を変更した親クラスがリリースされると突然自分の書いた子クラスが実行時エラーを起こすようになるわけだ。 そうならないためにはインスタンス変数へのアクセスに (protected な) アクセサを使う必要があるのだが、そのためには親クラスが明示的にそれらを提供している必要があるし、そもそも Perl にはメソッドのアクセス修飾子というものがないので完全な制御を与えるならばオブジェクトの内部状態がすべて public になってしまう。 そのような事情もあり、特にパフォーマンスが問題にならないようなアプリケーションコードでは Moose のようなリッチな語彙を提供するオブジェクトシステムを使うことが 公式のチュートリアルでも推奨 されてきた。Perl コアのオブジェクトシステムの改良は...

(multi-)term-mode に dirtrack させる zsh の設定

TL;DR .zshrc に以下を書けば良い: # Enable dirtrack on (multi-)term-mode. if [[ " $TERM " = eterm * ]]; then chpwd() { printf '\032/%s\n' " $PWD " } fi 追記 (May 14, 2025): oh-my-zsh を使っていれば emacs プラグインが勝手にやってくれる: plugins = ( emacs ) 仔細 term-mode は Emacs 本体に付属する端末エミュレータである。基本的には Emacs 内でシェルを起動するために使うもので、古い shell-mode よりも端末に近い動きをするので便利なのだが、一つ問題がある。シェル内でディレクトリを移動しても Emacs バッファの PWD がそのままでは追従しない点だ。 こういう追従を Emacs では Directory Tracking (dirtrack) と呼んだりするが、 shell-mode や eshell ではデフォルトで提供しているのに term-mode だけそうではない。 要するにシェル内で cd してもバッファの PWD は開いた時点のもの (基本的には直前にアクティヴだったバッファの PWD を継承する) のままなので、移動したつもりで C-x C-f などをするとパスが違ってアレっとなることになる。 実は term-mode にも dirtrack 機能自体は存在しているのだが、これは シェルがディレクトリ移動を伴うコマンドを実行したときに特定のエスケープシーケンスを含んだ行を印字することで Emacs 側に通知するという仕組み になっている。 Emacs と同じく GNU プロジェクトの成果物である bash は Emacs 内での動作を検出すると自動的にこのような挙動を取るが、zsh は Emacs の事情なんか知ったことではないので手動で設定する必要がある。 まずもって「ディレクトリ移動のコマンドをフックする」必要がある訳だが、zsh の場合これは簡単で cd / pushd / popd のようなディレクトリ...