Learning from and teaching in communities
コミュニティーで学び、そこで教えた事
Can we bring “Software Carpentry” to Japan? 「ソフトウィア・カーペントリー」を日本でやりませんか?
Presentation in English (with slides in English and Japanese)
#TokyoR 73th Meeting 2018-10-20
Tom Kelly (RIKEN IMS, Yokohama, Japan)
Learning from and teaching in communities
コミュニティーで学び、そこで教えた事
Can we bring “Software Carpentry” to Japan? 「ソフトウィア・カーペントリー」を日本でやりませんか?
Presentation in English (with slides in English and Japanese)
#TokyoR 73th Meeting 2018-10-20
Tom Kelly (RIKEN IMS, Yokohama, Japan)
1. Mojo is a new programming language designed for AI that is up to 35,000x faster than Python while maintaining Python's usability. It combines the performance of C with the simplicity of Python.
2. Mojo is intended to address limitations of Python for advanced AI applications. While Python is versatile, it relies on lower-level languages for performance-critical libraries. Mojo aims to simplify this.
3. Mojo features strong static typing, memory safety checks, and can leverage parallel processing using MLIR to achieve great performance for AI workloads. It is still in early development but can be tested on an online playground.
9. 前文
Twitter has open-sourced one of its most prized possessions — the recommendation
algorithm!
Twitterは最も価値のある所有物の一つをオープンソース化した。リコメンドアルゴリズムで
す!
Every day, Twitter serves over 150 billion Tweets to people’s devices.
毎日、Twitterは1500億を超えるツイートを人々のデバイスに届けている。
Every day, people post over 500 million Tweets.
毎日、人々は5億を超えるツイートを投稿している。
The recommendation algorithm shows you only a handful of top tweets that are relevant and
engaging for you.
そのリコメンデーションアルゴリズムはみなさんに、皆さんに関連した、そして興味のあるた
くさんのトップツイートのみを見せている。
open-sourced: 〜をOS化する
prized: 価値のある
possession: 所有物
handful: いっぱいの
relevant: 関連した
10. So how does the algorithm select Tweets that end up on your For You timeline?
どのようにそのアルゴリズムが「For You」タイムラインに乗っけるツイートを選択しているの?
Well, there are so many pieces to this puzzle.
そう。このパズルに対してはたくさんのピースがあるのだ。
The recommendation algorithm is a collection of different models, features, and services.
リコメンデーションアルゴリズムは異なるモデル、特徴、サービスの集合体からなっている。
(See the main blog illustration for how all the components work together)
Since I want to keep this non-technical, I won’t be covering the technical details of these
services.
私は、この記事をあまり技術的にしないようにしたいので、これらのサービスの技術的な詳細
をカバーしない。
But it’s pretty fascinating stuff!
でも、これはかなりホットな内容です!
collection: よせあつめ
fascinating: ホットな
stuff: 内容
11. I have provided a link to (the Twitter blog) and (other relevant resources) at the end where
you can explore all of them in detail.
私はTwitterブログと他の関連するリソースへのリンクをこの記事の終わりに提供した。そこで
は、みなさんがそれらのすべてを詳細に探索することができます。
Anyways, back to the stuff we can all easily understand.
ともかく、私たちが容易に理解できる内容に戻りましょう。
All of the components collectively try to answer two important questions:
構成要素のすべては2つの重要な疑問に合わせて答えようとする。
•What is the probability you will interact with another user in the future
将来、あなたが他のユーザーとやりとりをする可能性
•What are the communities on Twitter and what are trending Tweets within them?
Twitter上のコミュニティは何?そしてその中では何がトレンドのツイートなの?
This is what the communities look like…
ここでいう、コミュニティーとはこんな感じである。
( IMAGE )
There are 145k communities, which are updated every three weeks.
そこには145000ものコミュニティーがある。それは3週間ごとに更新される。
Some have millions of users in them.
explore: を探索する
collectively: 合わせて
probability: 可能性
interact with: ~と絡む
12. Demystifying The Recommendation Algorithm
リコメンドアルゴリズムの神秘を解く
The recommendation algorithm is built using a pipeline containing three stages:
リコメンドアルゴリズムは、3つのステージを含んだパイプラインを使って構成されている。
1.Candidate Tweet Sourcing
候補となるツイートの選別
2.Tweet Ranking
3.Tweet Filtering
demystify: ~の神秘を解く
13. 1. Candidate Tweet Sourcing
Extracts the best 1500 candidate Tweets relevant for a user from a pool of hundreds of
millions of Tweets.
この処理は、何億ものツイートのプールそのユーザーに関連するベスト1500ツイート候補を抽
出する。
There are two main candidate tweet sources: People you follow & people you don’t follow.
そこには、2つの主となるツイート供給源がある。それはあなたがフォローする人&あなたが
フォローしていない人。
Tweets are sourced from both sources in a 50–50 ratio.
ツイートは、両方の供給源から50-50の割合で供給される。
Tweets are sourced using two graph processing techniques: Real Graph & GraphJet, an
embedding technique known as SimClusters, and a custom matrix factorization algorithm.
ツイートは、2つのグラフ処理テクニックを用いて供給される。。。。。
(cough, cough…That’s getting too technical)
(ゴホゴホ、、、ちょっと難しすぎました) extract: 抽出する
ratio: 割合