OCR 5

OCR 기술 - 일상 속 텍스트 인식의 비밀

1. 오프닝 "안녕하세요, 여러분!요즘 스마트폰으로 못 하는 게 없죠? 그런데 이런 경험 해보신 적 있으세요?명함을 스마트폰으로 찍었는데, 이름과 전화번호를 자동으로 정리하고 싶었던 적.해외여행 중 간판이나 메뉴판을 찍고 바로 번역 결과를 보고 싶었던 순간.혹은 영수증이나 계약서를 디지털로 정리하려고 했지만, 하나하나 손으로 입력해야 했던 경험.이런 문제를 쉽게 해결해주는 기술이 바로 **OCR(광학 문자 인식)**입니다.오늘은 이 OCR 기술이 어떻게 시작되었고,지금 어떻게 발전해왔으며,우리가 실제로 어디에서 활용할 수 있는지까지 하나하나 알려드릴게요.영상을 끝까지 보시면, 이 기술이 얼마나 유용하고,또 여러분의 삶을 얼마나 더 편리하게 바꿀 수 있을지 확실히 이해하게 되실 겁니다.그럼 바로 시작해볼까..

카테고리 없음 2024.12.05

flask 서버 Docker로 패키징

Flask 애플리케이션을 Docker로 패키징하기클라우드에 서버를 실제로 올리기 위해 여러 가지 방법이 있지만, 저는 Google Cloud Run을 선택했습니다. 그 이유는 Google Cloud Run이 서버리스 환경이어서 별도의 요청이 없으면 비용이 들지 않는다는 점이 가장 매력적이었기 때문입니다.Google Cloud Run에 배포하려면 먼저 Flask 코드를 Docker로 패키징해야 합니다. 여기서는 제가 사용한 Docker로 패키징하는 방법을 정리해보겠습니다.사전 준비Docker 설치Windows를 사용하는 경우 WSL2 설치Dockerfile 작성Docker로 패키징하기 위해서는 Dockerfile만 있으면 됩니다. 아래는 제가 작성한 Dockerfile의 내용입니다:dockerfile코드 ..

Paddle OCR 메모리 누수(Memory leak) 해결 시도

1.os.environ['FLAGS_allocator_strategy'] = 'naive_best_fit' 설정공식 paddleocr git 서치 결과 CPU 환경에서 naive_best_fit 설정 시 CPU 메모리 관리 가능 하다는 git 발견 하지만 다른 플래그 사용 시랑 비슷했음 paddlepaddle 2.6.1 ocr 2.9.12.paddlepaddle 버전 2.6.2 에서 3.0.0b2 로 변경 (git서치결과)버전 변경 후 속도 급격하게 하락 paddle 3.0.2b ocr 2.9.1 3. paddlepaddle261 ocr 280 (다시 해볼필요성) 짱 빠르지만 급격하게 상승  4. paddle ocr 2.8.0 -> 2.6.13 버전 변경 paddle 260 ocr2613  5. padd..

Paddle OCR 메모리 누수 (memory leak) 비교

Paddle OCR 사용중 메모리 누수가 너무 심해서 메모리 추적을 한번 해봤는데요 일단 서버에 지속적으로 이미지를 보내주는 python 코드를 간단하게 짜서 1초 간격으로 이미지를 계속 보냈습니다.총 이미지는 320장 보냈고 그 후 mprof run --interval 0.5 python flask_server.py  명령어 통해서메모리를 .dat 파일로 기록해줍니다그후 메모리를 그래프화 하려면 아래 코드를 진행시켜 주면mprof plot .\resources.dat아래 사진처럼 메모리추적을 해주니 실제 어플리케이션 배포 시 많은 요청이 오면 어떻게 대응하는지 한번 살펴볼게요  1. 프로젝트 기본 코드 일단 기본으로 돌렸을때는 메모리가 아래 처럼 됩니다.처음 구간에 Paddleocr,yolov5 모델 ..

다양한 OCR 모듈 사용해보며 느낀 점 (Tesseract, EasyOCR, PaddleOCR, Google Cloud Vision, Clova OCR)

다양한 OCR 모듈 사용해보며 느낀 점 (Tesseract, EasyOCR, PaddleOCR, Google Cloud Vision, Clova OCR)프로젝트를 진행하면서 핵심 기술인 OCR에 대해 직접 다양한 모듈을 사용해 보았습니다. 각 OCR 모듈마다 특징이 뚜렷하게 나타났고, 이를 통해 프로젝트에 맞는 최적의 선택을 찾는 데 많은 도움이 되었습니다. 이번 포스팅에서는 제가 실제로 사용해 본 주요 OCR 모듈들의 사용 후기와 느낀 점을 공유하려 합니다.1. Tesseract OCR소개Google이 개발한 오픈소스 OCR 엔진으로, 다양한 언어를 지원하며 무료입니다.장점오픈소스로 수정 가능 (초보 개발자에겐 다소 무관한 장점).다양한 언어 인식에 강력 (하지만 한국어 인식률은 낮음).이미지 전처리를..