Comments (4)
일단, 결론부터 말씀 드리자면, 페이지별로 텍스트를 추출하는 것은 현재로써는 불가능합니다.
한글 파일 구조에는 어디서부터 어디까지가 몇 번쨰 페이지인지 정확히 표현되어 있지 않습니다.
한글 내에 있는 문단과 문단 안에 있는 컨트롤(표, 글상자) 들을 그려봐야 적확히 페이지를 정의할 수 있습니다. 이 쪽 부분은 아직 정확히 알지 못합니다. 도전해 보곤 싶지만 이 분야에서 유명한 폴라리스 오피스를 만든 인프라웨어라는 회사도 한글과 100% 동일한 결과을 만들지 못하는 것을 보면 어려운 거 같습니다.
from hwplib.
페이지 끝 부분에 특정 글자를 넣어서 자르시는게...
지금으로선 최선의 방법일 꺼 같습니다.
from hwplib.
저도 페이지 구분이 없는 점을 알고는 있었는데... 하 좀 더 생각을 해봐야겠네요^^ 답변감사합니다.
from hwplib.
임의의 한글 문서가 아닌... 특정한 한글 문서를 만들어서 페이지 별로 추출하고 싶다면, 한 페이지마다 구역(섹션)으로 나눠주고 구역별로 읽으면 될 수도 있습니다만.. @@;
from hwplib.
Related Issues (20)
- 안녕하세요! 테이블 관련해서 문의 드립니다. HOT 4
- ParagraphAdder를 통해 파일복사 시 복사한 파일의 개요문단 수준이 1로 고정되는 현상 HOT 2
- 누름틀에 값 입력 시 발생하는 현상 문의드립니다. HOT 2
- 특정 문서에서 문서의 개요를 지정한 형태로 읽지 못하는 현상 HOT 2
- 안녕하세요 테이블 관련 문의 드립니다! HOT 1
- 안녕하세요 오류 This is not paragraph. 질문 드립니다 HOT 10
- 안녕하세요, 상용 HWP 라이브러리 구입 문의 드립니다. HOT 1
- 한글 2024 버전의 파일을 읽지 못하는 경우가 발생합니다. HOT 2
- hwp 파일을 읽고 html 변환 HOT 5
- 안녕하세요. 라이브러리 사용중 궁금한점이 있어서 문의드립니다. HOT 4
- 안녕하세요. 테이블 셀 색상 관련해서 문의드립니다. HOT 1
- 폰트 색상 관련하여 질문드립니다. HOT 1
- 안녕하세요, 최신 JAR을 어디서 구할 수 있나요? (Hi, do you know where I can get the latest JAR?) HOT 1
- 1.1.5 버전 CtrlHeaderGso 클래스의 unkown 참조 이슈 HOT 1
- setCtrlHeaderRecord 함수에서 테이블이 여러개일 경우 테이블 높이를 계산해서 y좌표 지정을 하고 싶은데 테이블 높이를 계산하는 방법이 있을까요? HOT 1
- 안녕하세요. 질문이 있어 방문하게 되었습니다. HOT 1
- 안녕하세요. 질문드립니다. HOT 6
- Abnormal behavior when table have too many rows HOT 3
- 현재 문단에 위치 HOT 1
- HWP 내용의 각 문단에서 줄바꿈 문자(개행문자)가 있는지 어떻게 확인이 가능한가요. HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from hwplib.