STM32F4シリーズを使ってみる2 -STM32F4のメモリ構成を理解し基礎を作る-

20111201追:
最近複数の方からメールでご指摘いただきましたが、私はこのwikiとは関係ありません。
私の今回の記事からいくつかの文章を丸々コピペしていますが、私が後日誤りに
気付いて修正した内容が修正されずそのままになっていますので信用しないよう
注意してください。
20111201追:



今回は前回述べたとおり192kByteに増強された内蔵SRAMをどのように使うかを
決定し、お約束の標準関数の使用やFPUを用いた浮動小数点の計算をSTM32F4
Discovery上で実践してみます。


STM32F4系は192kByteのSRAMを持っていますが、実際は112kByte,16kByte,
64kByteの3ブロックに分かれています。後で図示しますが、112kByte分は
AHBバスマトリクスに接続された汎用SRAMで,16kByte分は同じくAHBバス
マトリクスに接続されているものの、112kByte分のSRAMと同時に読み書きが
できるように(主にEtherNetMAC&USB-OTG(HS)用に特化されているようです)
なっています。
アドレスは連続しているのでEthernetやUSB-OTG(HS)を使うつもりがない人は
128kByte分まるまる汎用SRAMとして使用することが出来ます。
その他細かい制約があるので各自データシートやマニュアルを参照のこと。
☝丸投げ

もうひとつの64kByte分はCore-Coupled Memory(CCM)と呼ばれ、Cortex-M4Fの
コアに直接接続されています。このSRAM領域はAHBバスマトリクス上にはなく、
DMAの読み書き先としてこの領域を使用できません!
(20111026追:実際に試しましたがHardFaultになったりDMAが完了
しなかったりで、やはりDMA用のメモリとして使用できませんでした)

また、128kByte分の汎用SRAMもSTM32F4のコアクロックと同様の168MHzで
アクセスできるので俗に言うTCM(Tightly-Coupled Memory)としての速度的
優位差もほとんどないでしょう。



以上の点を踏まえて、STM32F4系でつぶしが利くようにねむいさんはSRAMの
構成を下図のようにしてみました。

64kByteもある広大なスタック領域を君はどうつかうのか!?
注:CCM領域はDMAできません!!大事なことだから2度言います!!

この構想をリンカスクリプトに落とすと下図のような感じです。

この下にも長−く各セクションの定義が続きますが省略。
この構成で前回のTFT-LCDの表示テストも改めてクリア・またprintf系の
標準関数もUARTにリターゲットして動作を確認しました。


次にFPUを使って浮動小数点の演算のテストに取り掛かりました。
Cortex-M4Fは単精度の浮動小数点ユニットを持っています。GCCコンパイラから
この機能を使うためには浮動小数点命令に落とし込むようにフラグを与えて
あげないといけません。
具体的にどういうフラグを与えるかについては酔漢氏が昨年に考察されていました。
氏の情報を元に私の環境では以下の箇所の変更で単精度の浮動小数点命令に
切り替わりました。
-msoft-float("-mfloat-abi=soft"と同じ意味)

-mfloat-abi=softfp -mfpu=fpv4-sp-d16

-mfpu=fpv4-sp-d16は必須です。これが無いと倍精度の命令を使ってしまい、
実行したとたんにHardFaultになってしまいます。

ちなみに-mfloat-abi=※※※※ の意味はそれぞれ以下のように表されます。
-mfloat-abi=soft  :浮動小数点の演算に整数命令のみで構成された
               浮動小数点演算ライブラリ(soft-float)を使う。
-mfloat-abi=softfp :浮動小数点の演算に浮動小数点演算命令を使うが、
               floatを引数にする関数の呼び出し規約はsoft-floatと
               同じく汎用レジスタを使って値を渡す。
               (↑この仕組みはソフトウエア・リンケージといいます)
-mfloat-abi=hard  :浮動小数点の演算に浮動小数点演算命令を使い、
               floatを引数にする関数は浮動小数点レジスタを使って
               値を渡す。

酔漢氏のページでは"-mfloat-abi=hard"となっていました(GCC4.5.xからこの
オプションが利用可能)が、無償で利用できるSourceryCodebenchLite版にある
標準関数等のライブラリはsoft-floatでビルドされているため、標準関数を
絡めるとリンク時に引数渡しの不整合がおきてエラーになります。
これを回避するためにはCodebenchLite版のビルド済ライブラリを使わない設定
(-nostdlibオプションを付ける)を付与し、同じ機能を持つライブラリを一から
"-mfloat-abi=hard"でビルドしなおさなければなりません。
というわけでいちいちビルドするのめどいので以後は"-mfloat-abi=softfp"で。
20131226追:
GNU Tools for ARM Embedded Processorsなら"-mfloat-abi=hard"が
使用可能です!!



これでFPUの命令を含むプログラムがビルドできるようになりましためでたし
めでたし・・・と言いたい と こ ろ だ が !
ここも嵌ると思うので記しておきます。Cortex-M4Fの仕様によるとFPUは浮動
小数点命令が行われる前に(つまり起動時)に有効にしてやらないといけません。
STM32F4xxのサンプルではsystem_stm32f4xx.cのSystemInit()の最初で実行
されているものもありますが、テンプレートからsystem_stm32f4xx.cを生成
するとこの記述が欠けているのでほとんどの場合は自分で追加しないと
いけません。

☝のような感じでFPUの有効化を行ってください。



20120410変更:
実際にコンパイルオプションを変えて浮動小数点演算の箇所のアセンブラ
リストを比較してみました。Launchpad提供のGNUToolchainを使用しています。

-mfloat-abi=soft

FPUを一切使用しない場合です。FPUのレジスタは一切使用されず、また
浮動小数点演算ルーチンが呼ばれています。

-mfloat-abi=softfp -mfpu=fpv4-sp-d16

FPUを使用する場合(SoftFP)です。関数の値は汎用レジスタで渡されています。

-mfloat-abi=hard -mfpu=fpv4-sp-d16

FPUを使用する場合(HardFP)です。関数の値もFPUレジスタで渡されています。

printf関数は暗黙の型変換によってfloat値を渡してもdouble型に強制変換
されます。単精度のFPUしかもたないSTM32F4ではdouble型に変換するための
__aeabi_f2dルーチンが必ず挿入されます。


ってわけでこれでほぼ完全にCortex-M4Fとして開発を行う下地が整いました!
現在はSDカードとSPI接続のTFT-LCDとUARTをつなげていつものをこしらえる
ところまで進みました。STM32F4 Discovery回路構成の都合で、SDIOとFSMCが
使用できないのでSDカードもTFTLCDもSPI接続です。
はやくこいこいSTM32F407ZGT6!

あ、そうそう、Chan氏のTJpegDecも組み込ませてもらってます。

STM32F4はぢめました


…きちゃった♥


…STM32F2すら使いこなせてないうちにCortex-M4コアのSTM32F4が来て
しまいました…!
CPUクロックが168MHzにアップした上にFPU&DSPユニットが付きさらに
メモリも192kByteまでお付けしてお値段据え置き(購入当時日本円換算で1280円)
ですって奥さん!!



チップ単体はまだ手に入らないので(これも時間の問題ですね)すが、
評価キットとしてSTからSTM32F4Discoveryがすでに販売されています。
この評価キットはI2SコーデックにMEMSセンサもついていてアナログ信号の
処理も手軽に扱えそうですていうかそういう風に使わざるを得ないでしょうね…
苦手ですが。

20111201追:
秋月さんからも1650円で販売されました!

20230709追:
うわぁああああ4600円になってるうぅうううう1!!1!!



てわけでさっそく動かしてみました。すでにSTM32F4Discoveryの
ファームウエアパッケージで予習済みなのでいつものTFT液晶を
使って何か表示するプログラムをビルドし書き込んでみます。


CodesourceryはすでにCortex-M4Fに対応しています。ビルドオプションと
しては少しの変更でビルド可能です。
(注:上記のオプションではまだ不完全で、FPUを使った演算になりません!
  FPUを有効にする方法はこちらを)



STM32F2系(Cortex-M3)とアッパーコンパチであるため、OpenOCDはそのまま
読み書きとデバッグ(FPUレジスタ除く)を行うことが可能です!
ねむいさんはビルドしたプログラムの書き込みにVersaloonのSWDを使用しました。
(注:エラッタのせいでSTM32F2系とまったく同様のMCUIDとなっているようです。
   VersaloonはコアIDのほうは判別は行っていないようなので
   引っかかりませんでしたがFT2232系のJTAGアクセスではコアIDの判別に
   引っかかり、STM32F2系のcfgファイルのまんまだと警告を出しますが、
   先に述べたとおりアッパーコンパチのため、とくに実害はありません。
   私が公開しているOpenOCD用のCFGファイル群
   はすでにSTM32F4対応済です。)



びぃぶろくんが、かわかわ美人さんに欲情すると困るので小さく
20120124追:
Gaijinさんがinai-sanはHENTAIだって


とりあえず今回はほんのさわりだけですが、次回はせっかく192kByteに増強
してもアドレスが連続してるのは128kByte分でそのうちの16kByteはEthernet&
USBOTG-HSのDMA専用に事実上取られてしまうので実質112kByteで残りの
64kByteはバスマトリクス上にないから微妙に使いどころがないという
内蔵RAMの効率的な使い方とかをリンカスクリプトの組み方と交えて実践
していこうと思います!

Go to top of page