Decoder 解碼器:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>
#include <libswscale/swscale.h>#define WORD uint16_t
#define DWORD uint32_t
#define LONG int32_t#pragma pack(2)
typedef struct tagBITMAPFILEHEADER {WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits;
} BITMAPFILEHEADER, *PBITMAPFILEHEADER;typedef struct tagBITMAPINFOHEADER {DWORD biSize;LONG biWidth;LONG biHeight;WORD biPlanes;WORD biBitCount;DWORD biCompression;DWORD biSizeImage;LONG biXPelsPerMeter;LONG biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant;
} BITMAPINFOHEADER, *PBITMAPINFOHEADER;void saveBMP(struct SwsContext *img_convert_ctx, AVFrame *frame, int w, int h, char *filename)
{//1 先進行轉換, YUV420=>RGB24:// int w = img_convert_ctx->frame_dst->width;// int h = img_convert_ctx->frame_dst->height;int data_size = w * h * 3;AVFrame *pFrameRGB = av_frame_alloc();//avpicture_fill((AVPicture *)pFrameRGB, buffer, AV_PIX_FMT_BGR24, w, h);pFrameRGB->width = w;pFrameRGB->height = h;pFrameRGB->format = AV_PIX_FMT_BGR24;av_frame_get_buffer(pFrameRGB, 0);sws_scale(img_convert_ctx, (const uint8_t* const *)frame->data, frame->linesize,0, frame->height, pFrameRGB->data, pFrameRGB->linesize);//2 構造 BITMAPINFOHEADERBITMAPINFOHEADER header;header.biSize = sizeof(BITMAPINFOHEADER);header.biWidth = w;header.biHeight = h*(-1);header.biBitCount = 24;header.biCompression = 0;header.biSizeImage = 0;header.biClrImportant = 0;header.biClrUsed = 0;header.biXPelsPerMeter = 0;header.biYPelsPerMeter = 0;header.biPlanes = 1;//3 構造文件頭BITMAPFILEHEADER bmpFileHeader = {0,};//HANDLE hFile = NULL;DWORD dwTotalWriten = 0;DWORD dwWriten;bmpFileHeader.bfType = 0x4d42; //'BM';bmpFileHeader.bfSize = sizeof(BITMAPFILEHEADER) + sizeof(BITMAPINFOHEADER)+ data_size;bmpFileHeader.bfOffBits=sizeof(BITMAPFILEHEADER)+sizeof(BITMAPINFOHEADER);FILE* pf = fopen(filename, "wb");fwrite(&bmpFileHeader, sizeof(BITMAPFILEHEADER), 1, pf);fwrite(&header, sizeof(BITMAPINFOHEADER), 1, pf);fwrite(pFrameRGB->data[0], 1, data_size, pf);fclose(pf);//釋放資源//av_free(buffer);av_freep(&pFrameRGB[0]);av_free(pFrameRGB);
}static void pgm_save(unsigned char *buf, int wrap, int xsize, int ysize,char *filename)
{FILE *f;int i;f = fopen(filename,"w");fprintf(f, "P5\n%d %d\n%d\n", xsize, ysize, 255);for (i = 0; i < ysize; i++)fwrite(buf + i * wrap, 1, xsize, f);fclose(f);
}static int decode_write_frame(const char *outfilename, AVCodecContext *avctx,struct SwsContext *img_convert_ctx, AVFrame *frame, AVPacket *pkt)
{int ret = -1;char buf[1024];ret = avcodec_send_packet(avctx, pkt);if (ret < 0) {fprintf(stderr, "Error while decoding frame, %s(%d)\n", av_err2str(ret), ret);return ret;}while (ret >= 0) {fflush(stdout);ret = avcodec_receive_frame(avctx, frame);if(ret == AVERROR(EAGAIN) || ret == AVERROR_EOF){return 0;}else if( ret < 0){return -1;}/* the picture is allocated by the decoder, no need to free it */snprintf(buf, sizeof(buf), "%s-%d.bmp", outfilename, avctx->frame_number);/*pgm_save(frame->data[0], frame->linesize[0],frame->width, frame->height, buf);*/saveBMP(img_convert_ctx, frame, 160, 120, buf);}return 0;
}int main(int argc, char **argv)
{int ret;int idx;const char *filename, *outfilename;AVFormatContext *fmt_ctx = NULL;const AVCodec *codec = NULL;AVCodecContext *ctx = NULL;AVStream *inStream = NULL;AVFrame *frame = NULL; AVPacket avpkt;struct SwsContext *img_convert_ctx;if (argc <= 2) {fprintf(stderr, "Usage: %s <input file> <output file>\n", argv[0]);exit(0);}filename = argv[1];outfilename = argv[2];/* open input file, and allocate format context */if (avformat_open_input(&fmt_ctx, filename, NULL, NULL) < 0) {fprintf(stderr, "Could not open source file %s\n", filename);exit(1);}/* retrieve stream information */if (avformat_find_stream_info(fmt_ctx, NULL) < 0) {fprintf(stderr, "Could not find stream information\n");exit(1);}/* dump input information to stderr *///av_dump_format(fmt_ctx, 0, filename, 0);//av_init_packet(&avpkt);/* set end of buffer to 0 (this ensures that no overreading happens for damaged MPEG streams) *///memset(inbuf + INBUF_SIZE, 0, AV_INPUT_BUFFER_PADDING_SIZE);//idx = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0);if (idx < 0) {fprintf(stderr, "Could not find %s stream in input file '%s'\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO), filename);return idx;}inStream = fmt_ctx->streams[idx];/* find decoder for the stream */codec = avcodec_find_decoder(inStream->codecpar->codec_id);if (!codec) {fprintf(stderr, "Failed to find %s codec\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return AVERROR(EINVAL);}ctx = avcodec_alloc_context3(NULL);if (!ctx) {fprintf(stderr, "Could not allocate video codec context\n");exit(1);}/* Copy codec parameters from input stream to output codec context */if ((ret = avcodec_parameters_to_context(ctx, inStream->codecpar)) < 0) {fprintf(stderr, "Failed to copy %s codec parameters to decoder context\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return ret;}/* open it */if (avcodec_open2(ctx, codec, NULL) < 0) {fprintf(stderr, "Could not open codec\n");exit(1);}img_convert_ctx = sws_getContext(ctx->width, ctx->height,ctx->pix_fmt,160, 120,AV_PIX_FMT_BGR24,SWS_BICUBIC, NULL, NULL, NULL);if (img_convert_ctx == NULL){fprintf(stderr, "Cannot initialize the conversion context\n");exit(1);}frame = av_frame_alloc();if (!frame) {fprintf(stderr, "Could not allocate video frame\n");exit(1);}while (av_read_frame(fmt_ctx, &avpkt) >= 0) {if(avpkt.stream_index == idx){if (decode_write_frame(outfilename, ctx, img_convert_ctx, frame, &avpkt) < 0)exit(1);}av_packet_unref(&avpkt);}decode_write_frame(outfilename, ctx, img_convert_ctx, frame, NULL);avformat_close_input(&fmt_ctx);sws_freeContext(img_convert_ctx);avcodec_free_context(&ctx);av_frame_free(&frame);return 0;
}
saveBMP
函數分析
這個函數負責將一幀 AVFrame
(假設是 YUV 格式) 轉換為 BGR24 格式,并將其保存為 BMP 文件。
void saveBMP(struct SwsContext *img_convert_ctx, AVFrame *frame, int w, int h, char *filename)
{// 定義 saveBMP 函數。// - SwsContext *img_convert_ctx: FFmpeg 的圖像轉換上下文。// - AVFrame *frame: 輸入的原始視頻幀 (YUV)。// - int w, int h: 目標 BMP 圖像的寬度和高度。// - char *filename: 要保存的 BMP 文件名。// 1 先進行轉換, YUV420=>RGB24: (中文注釋)int data_size = w * h * 3; // 計算 BGR24 圖像數據的大小 (寬 * 高 * 3 字節/像素)。AVFrame *pFrameRGB = av_frame_alloc(); // 分配一個新的 AVFrame 用于存儲轉換后的 BGR 數據。pFrameRGB->width = w; // 設置 BGR 幀的寬度。pFrameRGB->height = h; // 設置 BGR 幀的高度。pFrameRGB->format = AV_PIX_FMT_BGR24;// 設置 BGR 幀的像素格式為 BGR24 (BMP 通常使用 BGR)。av_frame_get_buffer(pFrameRGB, 0); // 為 BGR 幀分配數據緩沖區。sws_scale(img_convert_ctx, // 調用 sws_scale 執行轉換和縮放。(const uint8_t* const *)frame->data, // 輸入幀的數據指針。frame->linesize, // 輸入幀的行大小數組。0, frame->height, // 輸入幀的起始行和高度 (0 表示從頭開始,處理整個高度)。pFrameRGB->data, // 輸出幀的數據指針。pFrameRGB->linesize); // 輸出幀的行大小數組。// 2 構造 BITMAPINFOHEADER (中文注釋)BITMAPINFOHEADER header; // 聲明 BMP 信息頭。header.biSize = sizeof(BITMAPINFOHEADER); // 設置結構體大小。header.biWidth = w; // 設置寬度。header.biHeight = h*(-1); // 設置高度為負數,表示圖像是 *自頂向下* 存儲的,這是 BMP 的常見做法。header.biBitCount = 24; // 設置位深為 24。header.biCompression = 0; // 設置不壓縮。header.biSizeImage = 0; // 設置圖像大小為 0。header.biClrImportant = 0; // 設置重要顏色數為 0。header.biClrUsed = 0; // 設置使用顏色數為 0。header.biXPelsPerMeter = 0; // 設置水平分辨率為 0。header.biYPelsPerMeter = 0; // 設置垂直分辨率為 0。header.biPlanes = 1; // 設置平面數為 1。// 3 構造文件頭 (中文注釋)BITMAPFILEHEADER bmpFileHeader = {0,}; // 聲明并清零 BMP 文件頭。DWORD dwTotalWriten = 0; // (未使用)DWORD dwWriten; // (未使用)bmpFileHeader.bfType = 0x4d42; // 設置文件類型為 'BM'。bmpFileHeader.bfSize = sizeof(BITMAPFILEHEADER) + sizeof(BITMAPINFOHEADER)+ data_size; // 計算總文件大小。bmpFileHeader.bfOffBits = sizeof(BITMAPFILEHEADER)+sizeof(BITMAPINFOHEADER); // 計算數據偏移量。FILE* pf = fopen(filename, "wb"); // 以二進制寫入模式打開輸出文件。fwrite(&bmpFileHeader, sizeof(BITMAPFILEHEADER), 1, pf); // 寫入文件頭。fwrite(&header, sizeof(BITMAPINFOHEADER), 1, pf); // 寫入信息頭。fwrite(pFrameRGB->data[0], 1, data_size, pf); // 寫入 BGR 像素數據。fclose(pf); // 關閉文件。// 釋放資源 (中文注釋)av_freep(&pFrameRGB->data[0]); // 釋放 BGR 幀的數據緩沖區 (注意:av_frame_get_buffer 分配的內存通常由 av_frame_free 統一管理,直接釋放 data[0] 可能不安全,更好的做法是只調用 av_frame_free)。av_frame_free(&pFrameRGB); // 釋放 BGR 幀結構體。
}
pgm_save
函數分析
這個函數用于將 YUV 幀的 Y 分量 (灰度圖) 保存為 PGM 格式的文件。雖然在 main
函數中被注釋掉了,但它是一個有用的調試工具。
static void pgm_save(unsigned char *buf, int wrap, int xsize, int ysize,char *filename)
{// 定義 pgm_save 函數。// - buf: Y 分量數據指針。// - wrap: Y 分量的行大小 (linesize)。// - xsize, ysize: 圖像的寬和高。// - filename: 輸出文件名。FILE *f; // 文件指針。int i; // 循環變量。f = fopen(filename,"w"); // 打開文件 (文本模式,但 PGM P5 是二進制)。fprintf(f, "P5\n%d %d\n%d\n", xsize, ysize, 255); // 寫入 PGM P5 格式的頭 (P5 表示二進制灰度圖,255 表示最大灰度值)。for (i = 0; i < ysize; i++) // 循環每一行。fwrite(buf + i * wrap, 1, xsize, f); // 寫入該行的像素數據。注意:這里沒有處理行大小 (wrap) 可能大于寬度 (xsize) 的情況,但 fwrite 會正確寫入 xsize 字節。fclose(f); // 關閉文件。
}
main
函數分析
int main(int argc, char **argv)
{int ret; // 返回值。int idx; // 視頻流索引。const char *filename, *outfilename; // 輸入文件名和輸出 *基礎* 文件名。AVFormatContext *fmt_ctx = NULL; // 格式上下文。const AVCodec *codec = NULL; // 解碼器。AVCodecContext *ctx = NULL; // 解碼器上下文。AVStream *inStream = NULL; // 輸入視頻流。AVFrame *frame = NULL; // 用于接收解碼幀。AVPacket avpkt; // 用于讀取包。struct SwsContext *img_convert_ctx; // 圖像轉換上下文。if (argc <= 2) { // 檢查參數。fprintf(stderr, "Usage: %s <input file> <output file>\n", argv[0]);exit(0);}filename = argv[1]; // 獲取輸入文件名。outfilename = argv[2]; // 獲取輸出基礎文件名。/* open input file, and allocate format context */if (avformat_open_input(&fmt_ctx, filename, NULL, NULL) < 0) { // 打開文件。fprintf(stderr, "Could not open source file %s\n", filename);exit(1);}/* retrieve stream information */if (avformat_find_stream_info(fmt_ctx, NULL) < 0) { // 獲取流信息。fprintf(stderr, "Could not find stream information\n");exit(1);}/* dump input information to stderr *///av_dump_format(fmt_ctx, 0, filename, 0); // (注釋掉了) 打印文件信息。idx = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0); // 查找最佳視頻流。if (idx < 0) { // 檢查是否找到。fprintf(stderr, "Could not find %s stream in input file '%s'\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO), filename);return idx;}inStream = fmt_ctx->streams[idx]; // 獲取視頻流指針。/* find decoder for the stream */codec = avcodec_find_decoder(inStream->codecpar->codec_id); // 查找解碼器。if (!codec) { // 檢查是否找到。fprintf(stderr, "Failed to find %s codec\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return AVERROR(EINVAL);}ctx = avcodec_alloc_context3(NULL); // 分配解碼器上下文。if (!ctx) { // 檢查分配。fprintf(stderr, "Could not allocate video codec context\n");exit(1);}/* Copy codec parameters from input stream to output codec context */if ((ret = avcodec_parameters_to_context(ctx, inStream->codecpar)) < 0) { // 復制參數。fprintf(stderr, "Failed to copy %s codec parameters to decoder context\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return ret;}/* open it */if (avcodec_open2(ctx, codec, NULL) < 0) { // 打開解碼器。fprintf(stderr, "Could not open codec\n");exit(1);}img_convert_ctx = sws_getContext(ctx->width, ctx->height, // 獲取圖像轉換上下文。ctx->pix_fmt, // 輸入寬度、高度、格式。160, 120, // 輸出寬度、高度 (硬編碼)。AV_PIX_FMT_BGR24, // 輸出格式 (BGR24)。SWS_BICUBIC, NULL, NULL, NULL); // 縮放算法 (雙三次插值)。if (img_convert_ctx == NULL) // 檢查轉換上下文是否創建成功。{fprintf(stderr, "Cannot initialize the conversion context\n");exit(1);}frame = av_frame_alloc(); // 分配 AVFrame 用于解碼。if (!frame) { // 檢查分配。fprintf(stderr, "Could not allocate video frame\n");exit(1);}while (av_read_frame(fmt_ctx, &avpkt) >= 0) { // 循環讀取數據包。if(avpkt.stream_index == idx){ // 如果包屬于視頻流。if (decode_write_frame(outfilename, ctx, img_convert_ctx, frame, &avpkt) < 0) // 調用解碼和保存函數。exit(1); // 如果失敗則退出。}av_packet_unref(&avpkt); // 釋放包引用。}decode_write_frame(outfilename, ctx, img_convert_ctx, frame, NULL); // 發送 NULL 包以刷新解碼器。avformat_close_input(&fmt_ctx); // 關閉輸入文件。sws_freeContext(img_convert_ctx); // 釋放轉換上下文。avcodec_free_context(&ctx); // 釋放解碼器上下文。av_frame_free(&frame); // 釋放 AVFrame。return 0; // 程序結束。
}
總結:
這個程序演示了如何:
- 使用
libavformat
打開視頻文件并讀取數據包。 - 使用
libavcodec
解碼視頻數據包為原始AVFrame
。 - 使用
libswscale
將解碼后的幀進行顏色空間轉換(例如 YUV 到 BGR)和圖像縮放。 - 手動構建 BMP 文件頭和信息頭。
- 將轉換后的圖像數據寫入 BMP 文件,實現視頻抽幀并保存為圖片序列的功能。
它是一個將視頻轉換為一系列 BMP 圖像的實用工具。