Skip to content

Commit 483579d

Browse files
update
1 parent 44e8f57 commit 483579d

3 files changed

Lines changed: 12 additions & 4 deletions

File tree

containers/llm-orchestrator-min/Dockerfile

Lines changed: 7 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -13,7 +13,11 @@ WORKDIR /app
1313

1414
# Ustawienie zmiennych środowiskowych dla pip
1515
ENV PYTHONDONTWRITEBYTECODE=1 \
16-
PYTHONUNBUFFERED=1
16+
PYTHONUNBUFFERED=1 \
17+
# Domyślny port API - można nadpisać przy uruchomieniu kontenera
18+
API_PORT=5000 \
19+
# Domyślne ustawienia optymalizacji
20+
USE_INT8=true
1721

1822
# Utworzenie katalogów dla aplikacji
1923
RUN mkdir -p /app/models /app/config /app/model-configs /app/data
@@ -48,8 +52,8 @@ else \n\
4852
echo "Model TinyLlama już istnieje, pomijanie pobierania." \n\
4953
fi' > /app/download_model.sh && chmod +x /app/download_model.sh
5054

51-
# Ekspozycja portu API
52-
EXPOSE 5000
55+
# Ekspozycja portu API - domyślnie 5000, ale można zmienić przez zmienną środowiskową API_PORT
56+
EXPOSE ${API_PORT}
5357

5458
# Uruchomienie API z wcześniejszym sprawdzeniem modelu
5559
CMD ["/bin/bash", "-c", "/app/download_model.sh && python -u api.py"]

containers/llm-orchestrator-min/api.py

Lines changed: 4 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -11,9 +11,12 @@
1111
# Konfiguracja optymalizacji
1212
USE_INT8 = os.environ.get('USE_INT8', 'true').lower() == 'true'
1313
DEVICE = "cpu"
14+
# Konfiguracja portu API z możliwością zmiany przez zmienną środowiskową
15+
API_PORT = int(os.environ.get('API_PORT', '5000'))
1416

1517
print("Ładowanie modelu TinyLlama-1.1B...")
1618
print(f"Optymalizacje: USE_INT8={USE_INT8}, DEVICE={DEVICE}")
19+
print(f"API będzie dostępne na porcie: {API_PORT}")
1720

1821
# Ładowanie tokenizera
1922
tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
@@ -91,4 +94,4 @@ def health():
9194

9295
if __name__ == '__main__':
9396
# Używamy threaded=False dla mniejszego zużycia pamięci w przypadku małych modeli
94-
app.run(host='0.0.0.0', port=5000, threaded=False)
97+
app.run(host='0.0.0.0', port=API_PORT, threaded=False)

containers/llm-orchestrator-min/requirements.txt

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -10,3 +10,4 @@ requests==2.31.0
1010
python-dotenv==1.0.0
1111
psutil==5.9.5
1212
bitsandbytes==0.40.2
13+
protobuf==3.20.3

0 commit comments

Comments
 (0)