File tree Expand file tree Collapse file tree
containers/llm-orchestrator-min Expand file tree Collapse file tree Original file line number Diff line number Diff line change @@ -13,7 +13,11 @@ WORKDIR /app
1313
1414# Ustawienie zmiennych środowiskowych dla pip
1515ENV PYTHONDONTWRITEBYTECODE=1 \
16- PYTHONUNBUFFERED=1
16+ PYTHONUNBUFFERED=1 \
17+ # Domyślny port API - można nadpisać przy uruchomieniu kontenera
18+ API_PORT=5000 \
19+ # Domyślne ustawienia optymalizacji
20+ USE_INT8=true
1721
1822# Utworzenie katalogów dla aplikacji
1923RUN mkdir -p /app/models /app/config /app/model-configs /app/data
@@ -48,8 +52,8 @@ else \n\
4852 echo "Model TinyLlama już istnieje, pomijanie pobierania." \n \
4953fi' > /app/download_model.sh && chmod +x /app/download_model.sh
5054
51- # Ekspozycja portu API
52- EXPOSE 5000
55+ # Ekspozycja portu API - domyślnie 5000, ale można zmienić przez zmienną środowiskową API_PORT
56+ EXPOSE ${API_PORT}
5357
5458# Uruchomienie API z wcześniejszym sprawdzeniem modelu
5559CMD ["/bin/bash" , "-c" , "/app/download_model.sh && python -u api.py" ]
Original file line number Diff line number Diff line change 1111# Konfiguracja optymalizacji
1212USE_INT8 = os .environ .get ('USE_INT8' , 'true' ).lower () == 'true'
1313DEVICE = "cpu"
14+ # Konfiguracja portu API z możliwością zmiany przez zmienną środowiskową
15+ API_PORT = int (os .environ .get ('API_PORT' , '5000' ))
1416
1517print ("Ładowanie modelu TinyLlama-1.1B..." )
1618print (f"Optymalizacje: USE_INT8={ USE_INT8 } , DEVICE={ DEVICE } " )
19+ print (f"API będzie dostępne na porcie: { API_PORT } " )
1720
1821# Ładowanie tokenizera
1922tokenizer = AutoTokenizer .from_pretrained (MODEL_PATH )
@@ -91,4 +94,4 @@ def health():
9194
9295if __name__ == '__main__' :
9396 # Używamy threaded=False dla mniejszego zużycia pamięci w przypadku małych modeli
94- app .run (host = '0.0.0.0' , port = 5000 , threaded = False )
97+ app .run (host = '0.0.0.0' , port = API_PORT , threaded = False )
Original file line number Diff line number Diff line change @@ -10,3 +10,4 @@ requests==2.31.0
1010python-dotenv == 1.0.0
1111psutil == 5.9.5
1212bitsandbytes == 0.40.2
13+ protobuf == 3.20.3
You can’t perform that action at this time.
0 commit comments