continue를 이용한 로컬 AI 코딩 설정

폐쇄망에서 슬프게 코딩하는 사람은 OpenAI, Cluade 를 쓸수가 없다...

하지만, GPU 가 있는 기계가 있다면 오픈 AI 모델을 이용해서 어느정도 사용이 가능하다!

1. 하드웨어

Nvidia Blackwell 칩 통합메모리 128G

Client : Windows 11

2. 구성

2.1 서버

ollama 설치하고, 적당한 ai 모델을 pull 해 놓으면 설정완료! ( gpt-oss:120b, qwen3-coder:30b)

로컬 기동으로 실행한다. ( 클라이언트에서 SSH 를 이용한 포워딩 설정으로 접속 )

2.2 클라이언트

SSH 를 이용해 서버 접속을 포워드 터널링?으로 셋팅한다. 올라마를 기본포트(11434)로 실행했다면, 다음과 같이 서버에 접속 하면 된다.

ssh -L 11434:127.0.0.1:11434 사용자명@서버IP

그리고 서버를 로컬같이 브라우저에서 접근하면!

준비 완료!

이제 vscode 를 설치하고, continue extension 을 설치한다.

왼쪽에 컨티뉴 플러그인의 창을 열고, 하단의 Add Chat Model 을 클릭해서 아래와 같이 Ollama / Autodetect 선택 후,

Connect 를 하면 자동으로 모델이 등록된다.

이제 맘껏 써보자!

Release Center