Twitter ID: WdWeaver スケールアウトの真実?
注意 個人かつ無料でできる範囲でやってることなんで、ある一例として考えてください。
GDD でも言ってるように、たぶんより良い方法があれば勝手に変えてくる部分だと思います。
Google App Engine の制限 リクエストレートの制限 無料クオータ 7,400 件 / 分 課金クオータ 30,000 件 / 分 リクエストハンドラの制限 レスポンスタイム 30 秒 同時動的リクエスト  30  どうしても増やしたい場合は Google に相談
GAE/J のスレッドって インスタンス1つにつき スレッドグループ見る限り 9 スレッド
リクエストを処理するスレッドは一つっぽい Network Runtime Thread って名前が付いてる
スレッド ID はいつも同じ 複数のリクエストがキューに積まれるっぽい どの程度積んでるかこの情報ほしいですね
TaskQueue なら分かるのに 同時動的リクエスト数=インスタンス数 インスタンスが 30 前後まで起動するってことだと思われます
制限を変えるには Google に相談
重要そうなこと 1 インスタンスにつきリクエストを処理できるスレッドは一つっぽい
レスポンスタイムに対する保証はない 実際には 1 秒しかかからない処理でも、キューの状況によっては、レスポンスが戻ってくるまでに、相当の時間がかかることがある。 後で説明しますが、アクセスが集中したときに積まれたリクエストは、 10 秒前後までかかる可能性があります。
実験 Jmeter の設定 スレッド、リクエスト数 60Thread
10Request リクエストの実行間隔  30req/sec
無償クオータで単純計算すると 123req/sec 程度が上限 テスト用サーブレット Thread.sleep(1000)
Session は今回使いません
結果 成功したリクエスト 586 失敗したリクエスト 14 スケールしたインスタンス数 16
Wait1 秒の時の実行結果
Wait1 秒の時の実行結果

appengine4java-scaleout