スキップしてメイン コンテンツに移動

多分週刊チラシの裏 (Oct 19, 2020 - Feb 26, 2021)

週刊とは言ったが毎週刊とは言ってないという言い訳。

C++ のコンパイルを高速化する小技

ビルドシステムやツールを変更せずともコーディングだけで改善できるコンパイル時間短縮テクニック。

  • #include を減らす
  • インライン化を明示的に避ける
  • 関数オーバーロードの可視性を制限する
  • 公開シンボルを減らす

の 4 本。

歯医者で歯を治したら記憶能力を失った話

歯医者で簡単な治療を受けた日から後、記憶が 90 分しか保持できなくなった英国の軍人の話。まるで「博士の愛した数式」だが実話である。

DRPK で売られていた Sim City っぽいゲームのリバースエンジニアリング

平壌市内のアプリストア (物理) で売られていた Sim City 風ゲームがインストールに失敗してライセンス認証で止まってしまったのでなんとか動かせないものかとリバースエンジニアリングしてみた話。

日本にあっては DPRK のデジタル事情というと 3G セルラーが現役とか国内 Web サイトのリストがポスター一枚に収まるとか何故かコンピュータ将棋の古豪とかの断片的な情報が伝え聞かれる程度だが、近頃は Android タブレットでゲームなどもできるらしい。 国内のインフラ及びエコシステム事情に合わせて元々フリーミアム + アプリ内課金モデルだったものが買い切り 5,000 KPW (< 1 USD) になっているなど、我々が失った自由が我々よりも不自由な (はずだと我々が信じている) 国に残存しているのは皮肉だろうか。

typosquatting は単なる typo じゃ済まない

typo を狙って人気のあるドメインやソフトウェアに類似した名前をつける手法 (typosquatting) は人を辟易させるのみならずセキュリティの脅威である。 IQT が 2017 年から 2020 年にかけて Python ライブラリの中央リポジトリである PyPI において行った調査で、メジャーなライブラリに名前を似せたマルウェアが 40 個確認されたとのこと。

その内 16 個が単純なスペルミス狙い (e.g., “urlib3” vs. “urllib3”) で、26 個は正当なパッケージと混同するような名前 (e.g., “nmap-python” vs. “python-nmap”) だった (2個のパッケージは両方の特徴を併せ持つため重複して計数されていることに注意。)

セマンティック Web に何が起きたのか

概念とその関係をメタデータとして記述することで機械可読なグラフデータベースを Web に加えようとしたセマンティック Web の当初の目論見が如何にして失敗し、Linked Open Data として再出発し、Web 検索・メディア・E コマースの各分野でどのように受容されてきたかのまとめ。

私見だがセマンティック Web が広まらなかったのは大部分のユーザにとって Web は出版メディアであってデータベースではなかったためだと思う。

Dr. Mario 64 に GNU gzip の inflate 実装が使われている模様

プロプライエタリな Nintendo 64 用ゲームである Dr. Mario 64 の流出したソースコードから GNU による gzip 実装の一部が見つかったとのこと。当然ながら GNU gzip は GPL ライセンスで配布されているソフトウェアである。

ただし inflate.c は原著者によってパブリックドメインと宣言されたコードが元になっているため、厳密に GPL の侵害となるかは微妙な問題である。

Linux 5.10 で 2038 年問題が 2486 年問題に緩和される

time_t を始めとする日時型のビット幅に起因する 2038 年問題 (a.k.a. Y2K38) への対応が Linux カーネルに取り込まれ始めたという話題。タイトルがフザけているのは The Reg の平常運行である。 Linux で標準的に使われているファイルシステムである XFS にパッチが取り込まれ、ディスク上のタイムスタンプにより多くのビット幅が割り当てられるようになる。

この変更によって問題の 2038 年まで 17 年近い移行猶予が持てることになる。なお「その間の面倒を見られる十分な数の人類が COVID-19 を生き延びたとしての話」とのこと。

合衆国とアメリカ原住民との条約のデジタルスキャンが公開された

米国立公文書館と Museum of Indian Arts and Culture の共同事業として、アメリカ原住民らと合衆国政府の間で交わされた 400 近い条約が初めてスキャンされオンラインで閲覧可能になった。

これらはかつて結ばれ、そして破られた約束というばかりでなく、土地や資源に関する対政府あるいは部族間の係争について今日でも重要な役割を担っているとのこと。

Growl 引退

Mac OS X の時代から使われてきた通知フレームワーク Growl の開発終了が宣言された。

2012 年に OS X Mountain Lion が Notication Center を導入して以来のアプリケーション開発者の流出と動作環境の ARM アーキテクチャへの移行、そして Growl 自身の今後の改良方針の欠如が理由とのこと。

火星じゃなくて金星を目指すべき理由

億万長者の白人男どもが火星を目指せとそそのかすのはまやかしで、金星の方が有望だという主張。

金星の方が若干距離が近いため到達に必要な時間とエネルギィが省ける上、地球と同程度の重力を持つため骨密度低下などの低重力環境における疾病のリスクが抑えられ、何より大気と地磁気を持つので宇宙放射線への防御がはじめから備わっているなど多くの優位性を根拠にしている。

ところで、当然ながら (現在の) 金星の地表は極端な高温・高圧環境なので生物は生存できない。ではどうするかというと電離層の下、雲の中に呼吸可能な大気を充填した風船を浮かべてその中に都市を建設するのだとか。

文字通り雲を掴むような話だが、それでも火星で放射線を避けるために地下深く、解決の見込みのない低重力環境に暮らすのと比べれば有望かも知れない。

差別的な用語の置き換えを推進する Inclusive Naming Initiative が発足

BLM ムーヴメントに呼応して “blacklist” / “whitelist” とか “master” / “slave” といった差別を想起させたり不要に攻撃的な用語を考え直す風潮が高まっているが、Cloud Native Computing Foundation を中心として大手テック企業も参加した Inclusive Naming Initiavie が発足した。

ロードマップ上では 2021 年第一四半期に代替用語とベストプラクティス、ツールや文書などを作成することを直近の目標としている。現在公開されているリソースはまだ途上かつ少量だが、有害な言葉の評価フレームワークなど既にある程度策定が進んでいるものもある。ちなみにトロルの対処法にも言及されているが、これは実際に難癖をつけてきたアシカ共によって実証済とのこと。

何故イタリア人は 11 時以降にカプチーノを飲まないのか

答え: イタリア人の多くは乳糖不耐症 (あるいはより広い意味の Lactose Malabsorber) なので日に 2 杯も飲めないから。

アジアの辺境に暮らしているとヨーロッパ人種は一様にミルクを飲めると思いがちだが、暑い地中海沿岸でのミルクの利用はチーズなど発酵食品が主だったため乳糖不耐症の人もざらにいるとのこと。

Microsoft FrontPage: The Good, The Bad, and The Ugly

タイトルだけイタリアつながり。かつて Microsoft Office の一員であった Web オーサリングソフトウェアである FrontPage の思い出。

ActiveX や ASP といった固有技術のサポートを通して Microsoft のロックイン戦略の走狗となったことが思い出されるが、それはそれとして非熟練者がプラットフォームに依存することなく「ホームページ」を制作できた、翻って今日の Web 制作はどうか。

「積読」の紹介

「積読 (tsundoku)」という言葉を英語圏に紹介する 2018 年の記事だが、その語の初出が少なくとも 19 世紀末に遡れること、Bibliomania との違い (Bibliomania は文献の収集自体に関心があるが Tsundoku は読む意思のある文献を読まない結果としての意図的でない収集) など日本語を母語とする我々も知らない蘊蓄が面白い。

多様性を描いた Nike の広告が日本で炎上

日本に住むマイノリティの実体験を基にした広告が「日本に差別があることを認識させる」という理解し難い「批判」に晒され炎上したという記事。

過去にあった同様の事例としてフランスの高級品ブランド Dior が「中国の領土から台湾を除いた地図を広告に使った」かどで中国で炎上した例が挙げられている。

環境意識を喚起する活動が日本で炎上

モデルであり環境省の「プラごみゼロアンバサダー」なる肩書を持つトラウデン直美氏が、首相官邸にて行われた環境フォーラムで提唱した「買い物をする際、店員に『環境に配慮した商品ですか』と尋ねる」行為が「悪質なクレーム」だという理解し難い「批判」に晒され炎上したという記事。

斯様な馬鹿げた曲解も発言者が若い女性であれば実際罷り通ることで、同様に激烈な中傷と脅迫に晒された環境保護活動家のグレタ・トゥンベリ氏のことも思い起こされる。

1 MB クラブ

アセットと JavaScript で膨れ上がった今日の Web において「クライアントがダウンロードするリソースが 1MB 未満である」サイトのリスト。なお Hacker News でバズった結果サイトの登録依頼が殺到しており一時受付停止中 (as of Dec 18) との由。

ちなみに Web の総本山である W3C のサイトは 870.5 KB、味気なさすぎるデザインで有名な Craigslist も 734.4 KB と 1 MB クラブの中ではあまり奮わない。

一週間でなれる!スパコンプログラマ

著者は慶応大学の渡辺宙志准教授 (Twitter のロボ太 (@kaityo256) の人) の手になる現代の超並列型スーパーコンピュータ向けの分散プログラミング入門 (日本語)。

MPI を使ったプロセス並列とか分割した上での各ノード上での SIMD 命令とかの話で、「入門」と書いてあるが実際に入門書である、念の為。

コメント

このブログの人気の投稿

Perl 7 より先に Perl 5.34 が出るぞという話

Perl 5 の次期バージョンとして一部後方互換でない変更 (主に間接オブジェクト記法の削除とベストプラクティスのデフォルトでの有効化) を含んだメジャーバージョンアップである Perl 7 がアナウンスされたのは昨年の 6 月 のことだったが、その前に Perl 5 の次期周期リリースである Perl 5.34 が 5 月にリリース予定 である。 現在開発版は Perl 5.33.8 がリリースされておりユーザから見える変更は凍結、4 月下旬の 5.33.9 で全コードが凍結され 5 月下旬に 5.34.0 としてリリース予定とのこと。 そういうわけで事前に新機能の予習をしておく。 8進数数値リテラルの新構文 見た瞬間「マジかよ」と口に出た。これまで Perl はプレフィクス 0 がついた数値リテラルを8進数と見做してきたが、プレフィクスに 0o (zero, small o) も使えるようになる。 もちろんこれは2進数リテラルの 0b や 16進数リテラルの 0x との一貫性のためである。リテラルと同じ解釈で文字列を数値に変換する組み込み関数 oct も` 新構文を解するようになる。 昨今無数の言語に取り入れられているリテラル記法ではあるが、この記法の問題は o (small o) と 0 (zero) の区別が難しいことで、より悪いことに大文字も合法である: 0O755 Try / Catch 構文 Perl 5 のリリース以来 30 年ほど待たれた実験的「新機能」である。 Perl 5 における例外処理が特別な構文でなかったのは予約語を増やさない配慮だったはずだが、TryCatch とか Try::Tiny のようなモジュールが氾濫して当初の意図が無意味になったというのもあるかも知れない。 use feature qw/ try / ; no warnings qw/ experimental::try / ; try { failable_operation(); } catch ( $e ) { recover_from_error( $e ); } Raku (former Perl 6) だと CATCH (大文字なことに注意) ブロックが自分の宣言されたスコープ内で投げられた例外を捕らえる

部分継続チュートリアル

この文書について これは Community Scheme Wiki で公開されている composable-continuations-tutorial (2010年09月30日版)の日本語訳です。 誤字脱字・誤訳などがありましたらコメントあるいはメールで御指摘いただけると幸いです。 本訳は原文のライセンスに基づき Creative Commons Attribution-ShareAlike 2.0 Generic の下で公開されます。 Original text: Copyright© 2006-2010 Community Scheme Wiki Japanese translation: Copyright© 2011 SATOH Koichi 本文 部分継続(Composable continuation)は継続区間を具象化することで制御を逆転させるものです。 ウンザリするほど複雑な概念を表す長ったらしいジャーゴンのように聞こえますが、実際はそうではありません。今からそれを説明します。 reset と shift という2つのスペシャルフォームを導入するところから始めましょう [1] 。 (reset expression) は特別な継続を作るなりスタックに目印を付けるなりしてから expression を評価します。簡単に言えば、 expression が評価されるとき、あとから参照できる評価中の情報が存在するということです。 実際には shift がこの情報を参照します。 (shift variable expression) は目印のついた場所、つまり reset を使った場所にジャンプし、その場所から shift を呼び出した場所までのプログラムの断片を保存します; これはプログラムの区間を「部分継続」として知られる組み合わせ可能な手続きに具象化し、この手続きに variable を束縛してから expression を評価します。 組み合わせ可能(Composable)という語はその手続きが呼び出し元に戻ってくるため、他の手続きと組み合わせられることから来ています。 Composable continuationの別名として例えば限定継続(Delimited continuation)や部分継続(Partia

開発環境の構築に asdf が便利なので anyenv から移行した

プロジェクト毎に異なるバージョンの言語処理系やツールを管理するために、pyenv や nodenv など *env の利用はほとんど必須となっている。 これらはほとんど一貫したコマンド体系を提供しており、同じ要領で様々な環境構築ができる非常に便利なソフトウェアだが、それを使うことで別の問題が出てくる: *env 自身の管理である。 無数の *env をインストールし、シェルを設定し、場合によりプラグインを導入し、アップデートに追従するのは非常に面倒な作業だ。 幸いなことにこれをワンストップで解決してくれるソリューションとして anyenv がある。これは各種 *env のパッケージマネージャというべきもので、一度 anyenv をインストールすれば複数の *env を簡単にインストールして利用できる。さらに anyenv-update プラグインを導入すればアップデートまでコマンド一発で完了する。素晴らしい。 そういうわけでもう長いこと anyenv を使ってきた。それで十分だった。 ——のだが、 ここにもう一つ、対抗馬となるツールがある。 asdf である。anyenv に対する asdf の優位性は大きく2つある: 一貫性と多様性だ。 一貫性 “Manage multiple runtime versions with a single CLI tool” という触れ込み通り、asdf は様々な言語やツールの管理について一貫したインタフェースを提供している。対して anyenv は *env をインストールするのみで、各 *env はそれぞれ個別のインタフェースを持っている。 基本的なコマンド体系は元祖である rbenv から大きく外れないにしても、例えば jenv のように単体で処理系を導入する機能を持たないものもある。それらの差異はユーザが把握し対応する必要がある。 多様性 asdf はプラグインシステムを持っている。というより asdf 本体はインタフェースを規定するだけで、環境構築の実務はすべてプラグイン任せである。 そのプラグインの数は本稿を書いている時点でおよそ 300 を数える。これは言語処理系ばかりでなく jq などのユーティリティや MySQL のようなミドルウェアも含むが、いずれにしても膨大なツールが asdf を使えば

京大テキストコーパスのパーサを書いた

要旨 CaboCha やなんかの出力形式であるところの京大テキストコーパス形式のパーサモジュールを Perl で書いたので紹介します。 Github Tarball on Github Ppages これを使うと例えば CaboCha の出力した係り受け関係を Perl のオブジェクトグラフとして取得できます。 使用例 単なる文節区切りの例。 #!/usr/bin/env perl use v5.18; use utf8; use IPC::Open3; use Parse::KyotoUniversityTextCorpus; use Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab; use Symbol qw//; my ($in, $out, $err); my $pid; BEGIN { ($in, $out, $err) = (Symbol::gensym, Symbol::gensym, Symbol::gensym); $pid = open3($in, $out, $err, cabocha => '-f1'); } END { close $out; close $err; waitpid $pid => 0 if defined $pid; } binmode STDOUT, ':encoding(utf8)'; binmode $in, ':encoding(utf8)'; binmode $out, ':encoding(utf8)'; my $parser = Parse::KyotoUniversityTextCorpus->new( morpheme_parser => Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab->new, ); say $in '星から出るのに、その子は渡り鳥を使ったんだと思う。'; say $in '出る日の朝、自分の星の片付けをした。'; close $in; my $sentence

BuckleScript が ReScript に改称し独自言語を導入した

Via: BuckleScript Good and Bad News - Psellos OCaml / ReasonML 文法と標準ライブラリを採用した JavaScript トランスパイラである BuckleScript が ReScript に改称した。 公式サイトによると改称の理由は、 Unifying the tools in one coherent platform and core team allows us to build features that wouldn’t be possible in the original BuckleScript + Reason setup. (単一のプラットフォームとコアチームにツールを統合することで従来の BuckleScript + Reason 体制では不可能であった機能開発が可能になる) とのこと。要は Facebook が主導する外部プロジェクトである ReasonML に依存せずに開発を進めていくためにフォークするという話で、Chromium のレンダリングエンジンが Apple の WebKit から Google 主導の Blink に切り替わったのと似た動機である (プログラミング言語の分野でも Object Pascal が Pascal を逸脱して Delphi Language になったとか PLT Scheme (の第一言語) が RnRS とは別路線に舵を切って Racket になったとか、割とよくある話である。) 公式ブログの Q&A によると OCaml / ReasonML 文法のサポートは継続され、既存の BuckleScript プロジェクトは問題なくビルドできるとのこと。ただし現時点で公式ドキュメントは ReScript 文法のみに言及しているなど、サポート水準のティアを分けて ReScript 文法を優遇することで移行を推進していく方針である。 上流である OCaml の更新は取り込み、AST の互換性も維持される。将来 ReScript から言語機能が削除されることは有り得るが、OCaml / ReasonML からは今日の BuckleScript が提供する機能すべてにアクセスできる。 現時点における ReScript の