Image Classification with Qwen 2.5 VL-32B Instruct

Automated large-scale image classification using Qwen/Qwen2.5-VL-32B-Instruct vision model. Processes images in parallel and outputs results to CSV files.

Features

Parallel batch processing using configurable thread pool (32 workers)
Checkpointing: saves progress every 100 images or 300 seconds
Detailed logging of successes, failures, and token usage
26 Categories: Product, Food, Finance, Architecture, Sport, etc.

Prerequisites

Python 3.8+
OpenAI Python client: pip install openai
Valid API key for Qwen model access

Setup

Set API Key:

export DASHSCOPE_API_KEY="your-api-key-here"

Change BASE_URL
- Update the BASE_URL variable in the script.
Prepare Image Directory:
- Place images in ../dataset/autodl-tmp/60k_jpg/
- Supported formats: .jpg, .jpeg, .png
Configure Script (optional):
- Edit IMAGE_DIR, OUTPUT_CSV, FAILED_CSV paths
- Adjust MAX_WORKERS and save intervals

Usage

python image_classification_60k.py

Output

Success: ../dataset/60k_image_classification.csv
- Columns: image_name, category, prompt_tokens, completion_tokens, total_tokens
Failures: ../dataset/60k_failed_image_classification.csv
- Columns: image_name, failure_reason
Logs: classification.log

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Image Classification with Qwen 2.5 VL-32B Instruct

Features

Prerequisites

Setup

Usage

Output

Categories

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Image Classification with Qwen 2.5 VL-32B Instruct

Features

Prerequisites

Setup

Usage

Output

Categories