From fc4a4d24718f92542e4c606d3f3ff2cf81e8f5e3 Mon Sep 17 00:00:00 2001
From: Kuang-che Wu <kcwu@csie.org>
Date: Wed, 8 Jan 2014 15:03:25 +0100
Subject: Fix UTF-8 character corruption every 32kb of text buffer

---
 src/fe-text/textbuffer.c | 12 ++++++++++++
 1 file changed, 12 insertions(+)

(limited to 'src/fe-text/textbuffer.c')

diff --git a/src/fe-text/textbuffer.c b/src/fe-text/textbuffer.c
index 0ba7d16e..69f5969c 100644
--- a/src/fe-text/textbuffer.c
+++ b/src/fe-text/textbuffer.c
@@ -23,6 +23,7 @@
 #include "module.h"
 #include "misc.h"
 #include "formats.h"
+#include "utf8.h"
 
 #include "textbuffer.h"
 
@@ -154,6 +155,17 @@ static void text_chunk_append(TEXT_BUFFER_REC *buffer,
         chunk = buffer->cur_text;
 	while (chunk->pos + len >= TEXT_CHUNK_USABLE_SIZE) {
 		left = TEXT_CHUNK_USABLE_SIZE - chunk->pos;
+
+		/* don't split utf-8 character. (assume we can split non-utf8 anywhere.) */
+		if (left < len && !is_utf8_leading(data[left])) {
+			int i;
+			for (i = 1; i < 4 && left >= i; i++)
+				if (is_utf8_leading(data[left - i])) {
+					left -= i;
+					break;
+				}
+		}
+
 		if (left > 0 && data[left-1] == 0)
 			left--; /* don't split the commands */
 
-- 
cgit v1.2.3