はじめまして!
株式会社神戸デジタル・ラボ DataIntelligenceチーム(以降DIチーム)の原口です。
今回は新入社員研修終了後から7月14日までの間、取り組んでいた国内最大のAI・データ分析コンペティションサイト「SIGNATE」で開催された、パナソニック株式会社主催の「間取り図解析アルゴリズム作成」コンペについてお話していきたいと思います!
この取り組みはKDLのニュースリリースでも取り上げられています!
今回の取り組みの目的
今回は、私たち自身が新卒でDIチームに配属されたこともあり、チーム配属後の研修も兼ねた挑戦でした。
データ分析を行い、精度を上げていくだけではなく、毎週末に同じチーム内の先輩へ情報報告会を行うことで、お客様への報告やコミュニケーションスキルを向上させるなどにもつながったと感じています。
コンペチームメンバー
今回のコンペには、新たにDIチームに配属された新人の原口・プラタマで参加しました。
原口俊樹
2021年度の新卒として神戸デジタル・ラボに入社し、DIチームに配属されました。
大学時代の研究では画像処理・解析を専門としており、古典的画像処理からCNNを用いた処理まで幅広く行っていました。
プラタマ・タウフィク
2021年でキャリア採用を通してKDLに入社しました。
構造化データ、非構造化データ、あらゆるデータ形式を対応したことがあります。背景がソフトウェア開発なので、AIをシステムに統合し、エンドユーザーが使えるようにすることに興味を持っています。データパイプライン構築とMLOpsに取り組んでいます。
そもそもSIGNATEとは?
よく日本版Kaggleと言われています。定期的に画像系や自然言語系、構造化データ系などの様々なコンペが行われています。かなり有名な企業のコンペなども行われており、我々エンジニアからすると非常にアツいものとなっている印象です。(今回はPanasonic様のコンペでした。以前ではJR様も参加されていましたね)
また、SIGNATEさんは経済産業省と協力してAI Questにも取り組んでいます。
AI Questは、近年加速度的に発展を遂げている「AI」に関する技術人材を育成するために行われているプログラムです。約半年の間に2テーマの課題に取り組み、「AI開発に向けた要件定義」、「AIモデル・検証設計・仕組みの構築」、「本実装に向けたプレゼンテーション」を学ぶことができます。
間取り図解析アルゴリズム
では、改めて今回のPanasonic様「間取り図解析アルゴリズム作成」コンペで取り組んだ内容をご紹介します。
背景・目的
住宅を建築する際、「床材・ドア部材の量」により見積金額が変動します。
そのため、企業側は見積金額を提示する前に、床材やドア部材の量を正しく把握しておくことが重要となります。
ですが、現状は、この床材やドア部材の量を算出する作業が、すべて手作業で行われおり、作業量は膨らみ、コストも時間もかかってしまうという問題があります。
そこで今回のコンペの目的は、間取り図画像から「建具」や「部屋領域」を検出することで、上記の手作業を大幅に削減することと設定されておりました。
ルール
今回認識する対象は、引戸・折戸・開戸・LDK・浴室・廊下です。
- 引戸・折戸・開戸はバウンディングボックスによりアノテーション
- LDK・浴室・廊下はポリゴンによってアノテーション
まとめると、建具はバウンディングボックス、部屋領域はポリゴンとなっています
各評価は以下の通りです。
建具では、各カテゴリ(開戸、引戸、折戸)に対するF1Scoreの重み付き平均(開戸:引戸:折戸=1:2:1)により認識精度を評価します。各カテゴリを認識できたかはIoUの値によって判定されます。
部屋領域では、各カテゴリ(浴室、LDK、廊下)に対するIoUの重み付き平均(浴室:LDK:廊下=1:2:2)により認識精度を評価します
最終的には、それぞれのスコアを「建具のスコア:部屋領域のスコア = 1:2」で重みづけをした平均値が最終スコアとして、評価が下されます。
このスコアを参加者全員で競っていくことになるのですが、私自身はコンペに参加するのが初めてで、右も左もわからず必死に戦っていました・・・
そのあたりも含め、次回はどのように開発を進めていったかお話しできればと思います!
データインテリジェンスチーム所属
データエンジニアを担当しています。画像認識を得意としており、画像認識・ニューラルネットワーク系の技術記事を発信していきます