STM32F4シリーズを使ってみる2 -STM32F4のメモリ構成を理解し基礎を作る-

20111201追:
つい最近複数の方からメールでご指摘いただきましたが、私はこのwikiとは関係ありません。
私の今回の記事からいくつかの文章をコピペしてたようですが、私が後日誤りに
気付いて修正した内容は修正されずにそのままになっているようなので注意してください。
20111201追:



今回は前回述べたとおり192kByteに増強された内蔵SRAMをどのように使うかを決定し、
お約束の標準関数の使用やFPUを用いた浮動小数点の計算をSTM32F4 Discovery
上で実践してみます。


STM32F4系は192kByteのSRAMを持っていますが、実際は112kByte,16kByte,64kByte
の3ブロックに分かれています。後で図示しますが、112kByte分はAHBバスマトリクスに
接続された汎用SRAMで,16kByte分は同じくAHBバスマトリクスに接続されているものの
112kByte分のSRAMと同時に読み書きができるように(主にEtherNetMAC&USB-OTG(HS)
用に特化されているようです)なっています。アドレスは連続しているのでEthernetや
USB-OTG(HS)を使うつもりがない人は128kByte分まるまる汎用SRAMとして使用する
ことが出来ます。
その他細かい制約があるので各自データシートやマニュアルを参照のこと(丸投げ!)。

もうひとつの64kByte分はCore-Coupled Memory(CCM)と呼ばれ、Cortex-M4Fのコアに直
接接続されています。このSRAM領域はAHBバスマトリクス上にはなく、マニュアルを読
む限りではDMAの読み書き先としてこの領域を使用できないようです。
(20111026追:実際に試しましたがHardFaultになったりDMAが完了しなかったりで、
       やはりDMA用のメモリとして使用できませんでした)

また、128kByte分の汎用SRAMもSTM32F4のコアクロックと同様の168MHzでアクセスできる
ので俗に言うTCM(Tightly-Coupled Memory)としての速度的優位差もほとんどないでしょう。



以上の点を踏まえて、STM32F4系でつぶしが利くようにねむいさんはSRAMの構成を下図
のようにしてみました。

64kByteもある広大なスタック領域を君はどうつかうのか!?
注:CCM領域はDMAできません!!大事なことだから2度言います!!

この構想をリンカスクリプトに落とすと下図のような感じです。

この下にも長−く各セクションの定義が続きますが省略。
この構成で前回のTFT-LCDの表示テストも改めてクリア・またprintf系の標準関数も
UARTにリターゲットして動作を確認しました。


次にFPUを使って浮動小数点の演算のテストに取り掛かりました。
Cortex-M4Fは単精度の浮動小数点ユニットを持っています。GCCコンパイラからこの機能
を使うためには浮動小数点命令に落とし込むようにフラグを与えてあげないといけません。
具体的にどういうフラグを与えるかについては酔漢氏が昨年に考察されていました。
氏の情報を元に私の環境では以下の箇所の変更で浮動小数点命令に切り替わりました。
-msoft-float("-mfloat-abi=soft"と同じ意味)

-mfloat-abi=softfp -mfpu=fpv4-sp-d16

-mfpu=fpv4-sp-d16は必須です。これが無いと倍精度の命令を使ってしまい、実行
したとたんにHardFaultになってしまいます。

ちなみに-mfloat-abi=※※※※ の意味はそれぞれ以下のように表されます。
-mfloat-abi=soft  :浮動小数点の演算に整数命令のみで構成された浮動小数
               点演算ライブラリ(soft-float)を使う。
-mfloat-abi=softfp :浮動小数点の演算に浮動小数点演算命令を使うが、floatを
               引数にする関数の呼び出し規約はsoft-floatと同じく汎用
               レジスタを使って値を渡す(ソフトウエア・リンケージ)。
-mfloat-abi=hard  :浮動小数点の演算に浮動小数点演算命令を使い、floatを
               引数にする関数は浮動小数点レジスタを使って値を渡す。

酔漢氏のページでは"-mfloat-abi=hard"となっていました(GCC4.5.xからこのオプショ
ンが利用可能)が、無償で利用できるSourceryCodebenchLite版にある標準関数等のラ
イブラリはsoft-floatでビルドされているため、標準関数を絡めるとリンク時に引数渡し
の不整合がおきてエラーになります。これを回避するためにはCodebenchLite版のビルド済
ライブラリを使わない設定(-nostdlibオプションを付ける)を付与し、同じ機能を持つライブ
ラリを一から"-mfloat-abi=hard"でビルドしなおさなければなりません。
というわけでいちいちビルドするのめどいので以後は"-mfloat-abi=softfp"で。
20131226追:
GNU Tools for ARM Embedded Processorsなら"-mfloat-abi=hard"が使用可能です!!


これでFPUの命令を含むプログラムがビルドできるようになりましためでたしめでたし
・・・と言いたい と こ ろ だ が !
ここも嵌ると思うので記しておきます。Cortex-M4Fの仕様によるとFPUは浮動小数点命令
が行われる前に(つまり起動時)に有効にしてやらないといけません。
STM32F4xxのサンプルではsystem_stm32f4xx.cのSystemInit()の最初で実行されている
ものもありますが、テンプレートからsystem_stm32f4xx.cを生成するとこの記述が欠け
ているのでほとんどの場合は自分で追加しないといけません。




20120410変更:
実際にコンパイルオプションを変えて浮動小数点演算の箇所のアセンブラリストを
比較してみました。Launchpad提供のGNUToolchainを使用しています。

-mfloat-abi=soft

FPUを一切使用しない場合です。FPUのレジスタは一切使用されず、また浮動小数点
演算ルーチンが呼ばれています。

-mfloat-abi=softfp -mfpu=fpv4-sp-d16

FPUを使用する場合(SoftFP)です。関数の値は汎用レジスタで渡されています。

-mfloat-abi=hard -mfpu=fpv4-sp-d16

FPUを使用する場合(HardFP)です。関数の値もFPUレジスタで渡されています。

printf関数は暗黙の型変換によってfloat値を渡してもdouble型に強制変換されます。
単精度のFPUしかもたないSTM32F4ではdouble型に変換するための__aeabi_f2dルーチンが
必ず挿入されます。


ってわけでこれでほぼ完全にCortex-M4Fとして開発を行う下地が整いました!
現在はSDカードとSPI接続のTFT-LCDとUARTをつなげていつものをこしらえるところまで
進みました。STM32F4 Discovery回路構成の都合で、SDIOとFSMCが使用できない
のでSDカードもTFTLCDもSPI接続です。はやくこいこいSTM32F407ZGT6!

あ、そうそう、Chan氏のTJpegDecも組み込ませてもらってます。

STM32F4はぢめました


…きちゃった♥


…STM32F2すら使いこなせてないうちにCortex-M4コアのSTM32F4が来てしまいました。
CPUクロックが168MHzにアップした上にFPU&DSPユニットが付きさらにメモリも192kByte
までお付けしてお値段据え置き(購入当時日本円換算で1280円)ですって奥さん!!



チップ単体はまだ手に入らないので(これも時間の問題ですね)すが、評価キットとして
STからSTM32F4Discoveryがすでに販売されています。この評価キットはI2Sコーデックに
MEMSセンサもついていてアナログ信号の処理も手軽に扱えそうです。ていうかそういう
風に使わざるを得ないでしょうね…苦手ですが。

20111201追:
秋月さんからも1650円で販売されました!



てわけでさっそく動かしてみました。すでにSTM32F4Discoveryのファームウエアパッケ
ージで予習済みなのでいつものTFT液晶に何か表示するプログラムをビルドし書き込ん
でみます。


CodesourceryはすでにCortex-M4Fに対応しています。ビルドオプションとしては
少しの変更でビルド可能です。
(注:上記のオプションではまだ不完全で、FPUを使った演算になりません!
  FPUを有効にする方法はこちらを)



STM32F2系(Cortex-M3)とアッパーコンパチであるため、OpenOCDはそのまま読み書き
とデバッグ(FPUレジスタ除く)を行うことが可能です!ねむいさんはビルドしたプロ
グラムの書き込みにVersaloonのSWDを使用しました。
(注:エラッタのせいでSTM32F2系とまったく同様のMCUIDとなっているようです。
   VersaloonはコアIDのほうは判別は行っていないようなので引っかかりませんでしたが
   FT2232系のJTAGアクセスではコアIDの判別に引っかかり、STM32F2系のcfgファ
   イルのまんまだと警告を出しますが、先に述べたとおりアッパーコンパチのため、
   とくに実害はありません。私が公開しているOpenOCD用のCFGファイル群はすでに
   STM32F4対応済です。)



びぃぶろくんが、かわかわ美人さんに欲情すると困るので小さく
20120124追:
Gaijinさんがinai-sanはHENTAIだって


とりあえず今回はほんのさわりだけですが、次回はせっかく192kByteに増強してもアド
レスが連続してるのは128kByte分でそのうちの16kByteはEthernet&USBOTG-HSの
DMA専用に事実上取られてしまうので実質112kByteで残りの64kByteはバスマトリクス
上にないから微妙に使いどころがないという内蔵RAMの効率的な使い方とかをリンカ
スクリプトの組み方と交えて実践していこうと思います!

Go to top of page