• これであなたもAIエンジニア!AIエンジニアリングのファーストノウハウ

これであなたもAIエンジニア!AIエンジニアリングのファーストノウハウ

2024.12.20読了目安: 7
メンター執筆
これであなたもAIエンジニア!AIエンジニアリングのファーストノウハウ

この記事に登場するメンター

メンターのプロフィール画像

Riku Nagano

HTML, CSS, JavaScript, 3D(Unity), Python, Amazon Web Service, Google Cloud Platform, Kubernetes, Firebase, 機械学習, Docker, SQL, 2D(Unity), React.js, Vue.js, Ethereum, Bitcoin, Azure, TypeScript, Node.js, AR, VR, Figma, Miro, React Native, MongoDB, Django, Flask, TensorFlow, UI/UX, GraphQL

こんにちは、長野陸です!

私は普段AIエンジニアとして、様々な企業様のお手伝いをしつつ、プライベートの時間で様々なシステム開発を行ってます。

みなさんは、AI関連のプログラミング開発の勉強が難しいと感じたことはありませんか?

今回は、私がAIエンジニアとして継続的にバリューを出しつづけるために心掛けていることとAIについての具体例をお話しします。

経歴紹介

そもそもAIとは?

2022年11月にchatGPTがリリースされてから、世界並びに社会では急速にAIそのものへの関心が高まると同時に、その技術の進歩は目覚ましくなりました。これは第四次AIブームとも呼ばれるものになりましたが、さて、そもそもAIとはなんでしょうか。

AI(人工知能)とは一般的に、人間の言葉の理解や認識、推論などの知的行動をコンピューターに行わせる技術のことを指します。

AIはその特性ゆえに、人間単体の手で行うにはあまりにも時間がかかりすぎること、例えばビッグデータの解析や音声や画像による認識と処理を、より短時間かつ高い精密度で行うことができるのです。

この能力が近年の目覚ましい技術の進歩により、より一層高められ、結果として人間の仕事を支援・補完するものとして、さまざまな企業や場面にとって欠かせないツールになりつつあります。

そのため、AIを積極的に知ることで最先端の技術や最新のトレンドにキャッチアップするとともに、インターネットや人から与えられた情報が本当に正しいかを判断できる力を磨くことが、今あなた方には求められているのです。

AIの機能 

一口にAIと言ってもその機能は多岐に渡ります。「どのような場面」で「何をしたいのか」という手段と目的、並びにAIに入力する内容(与える前提や条件)とその結果AIに出力を期待するものは何かを明確にしておくことで、より効率的かつ効果的にAIを使うことができます。

それではここから、入力と出力に着目しつつ、一般的に普及され始めたAIの技術をご紹介していきます

テキスト(自然言語処理)

<入力→文字、出力→文字>

利用例:チャットボット、翻訳機

自然言語処理(NLP)とは、コンピュータが私たちの使う言葉や文章を理解して処理するための技術のことです。人が書いたり話したりする内容を、コンピュータが読み取って意味を理解し、応答したり分類したりする仕組みを作ります。前述した通りchatGPTが広まったのをきっかけに、さらなる進化を遂げているAI技術の一つです

画像検出(Image Recognition)

<入力→画像/映像、出力→画像 / テキスト>

利用例:自動運転、スマホカメラの人物フォーカス機能、監視カメラの物体検出

コンピュータが画像の中にあるもの(例:人や物など)を見つけて認識する技術です。人が「これは猫だ」「あそこに車がある」とすぐにわかるように、AIも画像の中にどんなものがあるかを識別することができるのです。

画像認識は特定の形や色のパターンを認識する機能の一種で、近年は深層学習(ディープラーニング)という手法によってさらに精度が向上してきていますね。

​​音声認識

<入力→音声、出力→音声/テキスト>

利用例:コールセンターのオペレーター代行 、AIでの営業電話

音声認識とは、コンピュータが人間の声を聞いてその内容を文字や意味として理解する技術です。AIは私たちが話しかけた、その音声を分析して「何を言っているのか」を認識し、文章に変換したり適切な応答をします。この技術により電話を介した会話もAIに任せることができるようになりました。

OCR(Optical Character Recognition/Reader、光学的文字認識)

<入力→画像、出力→文字>

利用例:;レシートのデジタル保存、紙の書類のデジタル管理

OCRはAIが紙に印刷された文字や手書きの文字を読み取って、コンピュータが利用できるデジタルの文字コードに変換する技術です。本当に文字なのかを「認識」→文字であると「判断」→文字を「抽出」という過程によって、文字が画像から取り出されていきます。

AI用いる具体的な技術要素 

AIには「データ分析」タスクと「予測/分類モデル構築」タスクの2つがあります。

どちらもPythonを用いて簡単に実装できます。

  • データ分析
    • pandas
    • matplotlib
    • seaborn
    • SpaCy

  • 予測/分類モデル構築
    • pytorch
    • tensorflow
    • paddle
    • scikit-learn

下記Railwayで勉強できますので、ぜひPythonを一度TechTrainで勉強してみてください!

Railwayとは...

TechTrainが提供するメンターから得た幅広い知識とノウハウを凝縮し、初学者が着実にスキルアップできる実践型開発ドリルです。

まとめ

ここでは、一口にAIと言ってもその機能は細部に分かれている、という内容をご紹介しました。「AIが、」と大きな枠組みで捉えてしまうと難しい技術のように感じてしまいがちですが、その詳細を紐解いていけば個々の技術がそれぞれの分野にて存在していることがわかります。そのため、まずはその個々の技術について知識を持つようにしてみましょう。

また、AIに関わるものだけではなく、技術は日々更新・進歩しています。知識のアップデートがされることによって、ますますあなた方のエンジニアとしての価値や役割が高まっていくと言えるでしょう。ですのでぜひ、日々アンテナを高くして何事にも興味を持つ姿勢を忘れないでくださいね


いかがでしたか?

記事の内容やAIの開発について気になることがあれば、TechTrainの面談からRiku Naganoさんに質問ができます。
*自由な内容の面談はTechTrain Rank4以上の方限定の機能です

みなさんの「記事、読みました!」の声がメンターにとっても運営にとっても励みになります。ぜひ読んだ方は感想などを伝えてもらえたらとても嬉しいです。

メンター執筆シリーズについて

メンター執筆シリーズはこれからも定期的に配信中。

次回は、エッセイ風「不確実性から逃れられないITエンジニア」です。今までとは違った雰囲気の記事となっております。公開を楽しみにお待ちください!

エンジニアタイプ診断

あなたは何タイプ?無料でエンジニアタイプ診断を受けてみよう

かんたん約1分で診断!あなたの強みや傾向を8種類の動物で可視化します