Scala警察のすすめ
Naoki Takezoe
@takezoen
BizReach, Inc
有名OSSでもScala的に微妙なコードが多い
● ビッグデータ、機械学習界隈のプロダクトにこの
傾向がある
● 元々関数型界隈ではなく、ビッグデータ界隈や機
械学習界隈の人がSparkやMLlibを使うために
Scalaを使っているので仕方ない
● むしろScala警察活躍のチャンス!!!!
Scala的に微妙なコードあるある
その1. Procedure Syntax
Procedure Syntax
メソッドの戻り値がUnitの場合はメソッド定義の「=」
を省略できるという記法
def hello() {
"Hello World!!"
}
なぜダメか?
● 戻り値の型がUnitになってしまう
● Javaから来た人が間違って書いてしまいがち
● 将来のバージョンのScalaでは廃止予定
def hello(): Unit = { "Hello World!!" }
def hello(): String = { "Hello World!!" }
こういうメソッドを定義しているつもりが・・・
実はこうなっている
どうすればよいか?
Procedure Syntaxは使わない
def hello(): String = {
"Hello World!!"
}
def hello() = {
"Hello World!!"
}
または
その2. Unit is not Unit value
Unit値を返すつもりでUnitと書いてしまう
def hello(): Unit = {
// ...いろいろ処理...
Unit
}
これ
なぜダメか?
● Unit値は()、UnitはUnitオブジェクト
● メソッドの戻り値など、実害はないケースが多い
ので気づきにくい
scala> val x = ()
x: Unit = ()
scala> val x = Unit
x: Unit.type = object scala.Unit
どうすればよいか?
Unitではなく()と書きましょう
def hello(): Unit = {
// ...いろいろ処理...
()
}
こう書く
その3. Auto Tupling
引数を自動的にタプルに変換する機能
def hello(x: (String, String)): String = {
x._1 + " " + x._2
}
// 本来であればこう呼び出す
hello(("Naoki", "Takezoe"))
// こう書ける
hello("Naoki", "Takezoe")
なぜダメか?
● なぜコンパイルエラーになるのかわかりにくい
ケースがある
● リファクタリング時に意図せずコンパイルが通って
しまうケースがある
どうすればよいか?
● Auto-Tuplingを使わずに記述する
● 名前付き引数で引数を渡す
● Any型の引数を持つメソッドを定義する場合や、
リファクタリング時は特に注意する
Scalaパズルにも
書いてある!
その3. Escape by "return"
def hello(name: String): String = {
return s"Hello ${name}!"
}
そもそもこういう場合はreturnは不要
引数チェックのEarly return
def hello(names: Seq[String]): String = {
// Seqが空の場合
if(names.isEmpty) return ""
// Seqに空文字列が含まれている場合
names.foreach { name =>
if(name.isEmpty) return ""
}
// 実際の処理
names.mkString(", ")
}
なぜダメか?
● メソッドの戻り値の型推論が効かなくなるので戻り
値の型を明示的に記述する必要がある
● 場合によっては例外にコンパイルされている
(ControlThrowable)
どうすればよいか?
● 不要な場合は書かない
● if elseやコレクション操作に置き換える
● 使う場合は例外処理に気をつける
def hello(names: Seq[String]): String = {
// Seqが空の場合
if(names.isEmpty) ""
// Seqに空文字列が含まれている場合
else if(names.exists(_.isEmpty) ""
// 実際の処理
else names.mkString(", ")
}
例外処理をする場合
● Throwableでキャッチしない
● Throwableもキャッチする必要がある場合は
NonFatalを使う
try {
// ...処理...
} catch {
case NonFatal(t) => t.printStackTrace()
}
ControlThrowableなどは
マッチしない
他にもよくあるパターン
● varやmutableコレクション
○ ループカウンタやコレクションの詰め替え処理など
● whileループ
○ varやmutableなコレクションと組み合わせで使用されてい
ることが多い
○ returnやbreakなどとの合わせ技担っている場合も
ループカウンタが必要な場合
var i = 1
seq.foreach { x =>
println(s"${i}: ${x}")
i = i + 1
}
zipWithIndexを使う
seq.zipWithIndex.foreach { case (x, i) =>
println(s"${i + 1}: ${x}")
}
途中で処理を止めたい場合
var line: String = null
val lines = new ListBuffer[String]()
line = reader.readLine()
while(line != null){
lines += line
line = reader.readLine()
}
Iterator.continuallyが使える
val lines = Iterator.continually(reader.readLine())
.takeWhile(_ != null)
バッドコードを検出するために
● コンパイラのオプションを設定しよう
● Lintツールを使おう
○ scalastyle
○ wartremover
scalacOptions in ThisBuild ++= Seq(
"-feature", "-unchecked", "-deprecation",
"-Xfuture", "-Yno-adapted-args", "-Ywarn-dead-code",
"-Ywarn-numeric-widen"
)
SparkがScalaの隙間産業を生み出している
● PredictionIO
● Spark MLlib
● Mahout-Spark
● Elasticsearch-Hadoop
SparkがScalaの隙間産業を生み出している
● PredictionIO
● Spark MLlib
● Mahout-Spark
● Elasticsearch-Hadoop
あなたもScala警察として
OSSコミッタになろう!

Scala警察のすすめ