CbC/CbC_gcc: gcc/ada/libgnat/g-decstr.adb annotate

annotate gcc/ada/libgnat/g-decstr.adb @ 131:84e7813d76e9

gcc-8.2

author	mir3636
date	Thu, 25 Oct 2018 07:37:49 +0900
parents	04ced10e8804
children	1830386684a0

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 ------------------------------------------------------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	2 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	3 -- GNAT RUN-TIME COMPONENTS --
04ced10e8804 gcc 7 kono parents: diff changeset	4 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	5 -- G N A T . D E C O D E _ S T R I N G --
04ced10e8804 gcc 7 kono parents: diff changeset	6 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	7 -- S p e c --
04ced10e8804 gcc 7 kono parents: diff changeset	8 -- --
131 84e7813d76e9 gcc-8.2 mir3636 parents: 111 diff changeset	9 -- Copyright (C) 2007-2018, AdaCore --
111 04ced10e8804 gcc 7 kono parents: diff changeset	10 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	11 -- GNAT is free software; you can redistribute it and/or modify it under --
04ced10e8804 gcc 7 kono parents: diff changeset	12 -- terms of the GNU General Public License as published by the Free Soft- --
04ced10e8804 gcc 7 kono parents: diff changeset	13 -- ware Foundation; either version 3, or (at your option) any later ver- --
04ced10e8804 gcc 7 kono parents: diff changeset	14 -- sion. GNAT is distributed in the hope that it will be useful, but WITH- --
04ced10e8804 gcc 7 kono parents: diff changeset	15 -- OUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY --
04ced10e8804 gcc 7 kono parents: diff changeset	16 -- or FITNESS FOR A PARTICULAR PURPOSE. --
04ced10e8804 gcc 7 kono parents: diff changeset	17 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	18 -- As a special exception under Section 7 of GPL version 3, you are granted --
04ced10e8804 gcc 7 kono parents: diff changeset	19 -- additional permissions described in the GCC Runtime Library Exception, --
04ced10e8804 gcc 7 kono parents: diff changeset	20 -- version 3.1, as published by the Free Software Foundation. --
04ced10e8804 gcc 7 kono parents: diff changeset	21 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	22 -- You should have received a copy of the GNU General Public License and --
04ced10e8804 gcc 7 kono parents: diff changeset	23 -- a copy of the GCC Runtime Library Exception along with this program; --
04ced10e8804 gcc 7 kono parents: diff changeset	24 -- see the files COPYING3 and COPYING.RUNTIME respectively. If not, see --
04ced10e8804 gcc 7 kono parents: diff changeset	25 -- <http://www.gnu.org/licenses/>. --
04ced10e8804 gcc 7 kono parents: diff changeset	26 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	27 -- GNAT was originally developed by the GNAT team at New York University. --
04ced10e8804 gcc 7 kono parents: diff changeset	28 -- Extensive contributions were provided by Ada Core Technologies Inc. --
04ced10e8804 gcc 7 kono parents: diff changeset	29 -- --
04ced10e8804 gcc 7 kono parents: diff changeset	30 ------------------------------------------------------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	31
04ced10e8804 gcc 7 kono parents: diff changeset	32 -- This package provides a utility routine for converting from an encoded
04ced10e8804 gcc 7 kono parents: diff changeset	33 -- string to a corresponding Wide_String or Wide_Wide_String value.
04ced10e8804 gcc 7 kono parents: diff changeset	34
04ced10e8804 gcc 7 kono parents: diff changeset	35 with Interfaces; use Interfaces;
04ced10e8804 gcc 7 kono parents: diff changeset	36
04ced10e8804 gcc 7 kono parents: diff changeset	37 with System.WCh_Cnv; use System.WCh_Cnv;
04ced10e8804 gcc 7 kono parents: diff changeset	38 with System.WCh_Con; use System.WCh_Con;
04ced10e8804 gcc 7 kono parents: diff changeset	39
04ced10e8804 gcc 7 kono parents: diff changeset	40 package body GNAT.Decode_String is
04ced10e8804 gcc 7 kono parents: diff changeset	41
04ced10e8804 gcc 7 kono parents: diff changeset	42 -----------------------
04ced10e8804 gcc 7 kono parents: diff changeset	43 -- Local Subprograms --
04ced10e8804 gcc 7 kono parents: diff changeset	44 -----------------------
04ced10e8804 gcc 7 kono parents: diff changeset	45
04ced10e8804 gcc 7 kono parents: diff changeset	46 procedure Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	47 pragma No_Return (Bad);
04ced10e8804 gcc 7 kono parents: diff changeset	48 -- Raise error for bad encoding
04ced10e8804 gcc 7 kono parents: diff changeset	49
04ced10e8804 gcc 7 kono parents: diff changeset	50 procedure Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	51 pragma No_Return (Past_End);
04ced10e8804 gcc 7 kono parents: diff changeset	52 -- Raise error for off end of string
04ced10e8804 gcc 7 kono parents: diff changeset	53
04ced10e8804 gcc 7 kono parents: diff changeset	54 ---------
04ced10e8804 gcc 7 kono parents: diff changeset	55 -- Bad --
04ced10e8804 gcc 7 kono parents: diff changeset	56 ---------
04ced10e8804 gcc 7 kono parents: diff changeset	57
04ced10e8804 gcc 7 kono parents: diff changeset	58 procedure Bad is
04ced10e8804 gcc 7 kono parents: diff changeset	59 begin
04ced10e8804 gcc 7 kono parents: diff changeset	60 raise Constraint_Error with
04ced10e8804 gcc 7 kono parents: diff changeset	61 "bad encoding or character out of range";
04ced10e8804 gcc 7 kono parents: diff changeset	62 end Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	63
04ced10e8804 gcc 7 kono parents: diff changeset	64 ---------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	65 -- Decode_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	66 ---------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	67
04ced10e8804 gcc 7 kono parents: diff changeset	68 procedure Decode_Wide_Character
04ced10e8804 gcc 7 kono parents: diff changeset	69 (Input : String;
04ced10e8804 gcc 7 kono parents: diff changeset	70 Ptr : in out Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	71 Result : out Wide_Character)
04ced10e8804 gcc 7 kono parents: diff changeset	72 is
04ced10e8804 gcc 7 kono parents: diff changeset	73 Char : Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	74 begin
04ced10e8804 gcc 7 kono parents: diff changeset	75 Decode_Wide_Wide_Character (Input, Ptr, Char);
04ced10e8804 gcc 7 kono parents: diff changeset	76
04ced10e8804 gcc 7 kono parents: diff changeset	77 if Wide_Wide_Character'Pos (Char) > 16#FFFF# then
04ced10e8804 gcc 7 kono parents: diff changeset	78 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	79 else
04ced10e8804 gcc 7 kono parents: diff changeset	80 Result := Wide_Character'Val (Wide_Wide_Character'Pos (Char));
04ced10e8804 gcc 7 kono parents: diff changeset	81 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	82 end Decode_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	83
04ced10e8804 gcc 7 kono parents: diff changeset	84 ------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	85 -- Decode_Wide_String --
04ced10e8804 gcc 7 kono parents: diff changeset	86 ------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	87
04ced10e8804 gcc 7 kono parents: diff changeset	88 function Decode_Wide_String (S : String) return Wide_String is
04ced10e8804 gcc 7 kono parents: diff changeset	89 Result : Wide_String (1 .. S'Length);
04ced10e8804 gcc 7 kono parents: diff changeset	90 Length : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	91 begin
04ced10e8804 gcc 7 kono parents: diff changeset	92 Decode_Wide_String (S, Result, Length);
04ced10e8804 gcc 7 kono parents: diff changeset	93 return Result (1 .. Length);
04ced10e8804 gcc 7 kono parents: diff changeset	94 end Decode_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	95
04ced10e8804 gcc 7 kono parents: diff changeset	96 procedure Decode_Wide_String
04ced10e8804 gcc 7 kono parents: diff changeset	97 (S : String;
04ced10e8804 gcc 7 kono parents: diff changeset	98 Result : out Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	99 Length : out Natural)
04ced10e8804 gcc 7 kono parents: diff changeset	100 is
04ced10e8804 gcc 7 kono parents: diff changeset	101 Ptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	102
04ced10e8804 gcc 7 kono parents: diff changeset	103 begin
04ced10e8804 gcc 7 kono parents: diff changeset	104 Ptr := S'First;
04ced10e8804 gcc 7 kono parents: diff changeset	105 Length := 0;
04ced10e8804 gcc 7 kono parents: diff changeset	106 while Ptr <= S'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	107 if Length >= Result'Last then
04ced10e8804 gcc 7 kono parents: diff changeset	108 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	109 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	110
04ced10e8804 gcc 7 kono parents: diff changeset	111 Length := Length + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	112 Decode_Wide_Character (S, Ptr, Result (Length));
04ced10e8804 gcc 7 kono parents: diff changeset	113 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	114 end Decode_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	115
04ced10e8804 gcc 7 kono parents: diff changeset	116 --------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	117 -- Decode_Wide_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	118 --------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	119
04ced10e8804 gcc 7 kono parents: diff changeset	120 procedure Decode_Wide_Wide_Character
04ced10e8804 gcc 7 kono parents: diff changeset	121 (Input : String;
04ced10e8804 gcc 7 kono parents: diff changeset	122 Ptr : in out Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	123 Result : out Wide_Wide_Character)
04ced10e8804 gcc 7 kono parents: diff changeset	124 is
04ced10e8804 gcc 7 kono parents: diff changeset	125 C : Character;
04ced10e8804 gcc 7 kono parents: diff changeset	126
04ced10e8804 gcc 7 kono parents: diff changeset	127 function In_Char return Character;
04ced10e8804 gcc 7 kono parents: diff changeset	128 pragma Inline (In_Char);
04ced10e8804 gcc 7 kono parents: diff changeset	129 -- Function to get one input character
04ced10e8804 gcc 7 kono parents: diff changeset	130
04ced10e8804 gcc 7 kono parents: diff changeset	131 -------------
04ced10e8804 gcc 7 kono parents: diff changeset	132 -- In_Char --
04ced10e8804 gcc 7 kono parents: diff changeset	133 -------------
04ced10e8804 gcc 7 kono parents: diff changeset	134
04ced10e8804 gcc 7 kono parents: diff changeset	135 function In_Char return Character is
04ced10e8804 gcc 7 kono parents: diff changeset	136 begin
04ced10e8804 gcc 7 kono parents: diff changeset	137 if Ptr <= Input'Last then
04ced10e8804 gcc 7 kono parents: diff changeset	138 Ptr := Ptr + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	139 return Input (Ptr - 1);
04ced10e8804 gcc 7 kono parents: diff changeset	140 else
04ced10e8804 gcc 7 kono parents: diff changeset	141 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	142 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	143 end In_Char;
04ced10e8804 gcc 7 kono parents: diff changeset	144
04ced10e8804 gcc 7 kono parents: diff changeset	145 -- Start of processing for Decode_Wide_Wide_Character
04ced10e8804 gcc 7 kono parents: diff changeset	146
04ced10e8804 gcc 7 kono parents: diff changeset	147 begin
04ced10e8804 gcc 7 kono parents: diff changeset	148 C := In_Char;
04ced10e8804 gcc 7 kono parents: diff changeset	149
04ced10e8804 gcc 7 kono parents: diff changeset	150 -- Special fast processing for UTF-8 case
04ced10e8804 gcc 7 kono parents: diff changeset	151
04ced10e8804 gcc 7 kono parents: diff changeset	152 if Encoding_Method = WCEM_UTF8 then
04ced10e8804 gcc 7 kono parents: diff changeset	153 UTF8 : declare
04ced10e8804 gcc 7 kono parents: diff changeset	154 U : Unsigned_32;
04ced10e8804 gcc 7 kono parents: diff changeset	155 W : Unsigned_32;
04ced10e8804 gcc 7 kono parents: diff changeset	156
04ced10e8804 gcc 7 kono parents: diff changeset	157 procedure Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	158 pragma Inline (Get_UTF_Byte);
04ced10e8804 gcc 7 kono parents: diff changeset	159 -- Used to interpret 2#10xxxxxx# continuation byte in UTF-8 mode.
04ced10e8804 gcc 7 kono parents: diff changeset	160 -- Reads a byte, and raises CE if the first two bits are not 10.
04ced10e8804 gcc 7 kono parents: diff changeset	161 -- Otherwise shifts W 6 bits left and or's in the 6 xxxxxx bits.
04ced10e8804 gcc 7 kono parents: diff changeset	162
04ced10e8804 gcc 7 kono parents: diff changeset	163 ------------------
04ced10e8804 gcc 7 kono parents: diff changeset	164 -- Get_UTF_Byte --
04ced10e8804 gcc 7 kono parents: diff changeset	165 ------------------
04ced10e8804 gcc 7 kono parents: diff changeset	166
04ced10e8804 gcc 7 kono parents: diff changeset	167 procedure Get_UTF_Byte is
04ced10e8804 gcc 7 kono parents: diff changeset	168 begin
04ced10e8804 gcc 7 kono parents: diff changeset	169 U := Unsigned_32 (Character'Pos (In_Char));
04ced10e8804 gcc 7 kono parents: diff changeset	170
04ced10e8804 gcc 7 kono parents: diff changeset	171 if (U and 2#11000000#) /= 2#10_000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	172 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	173 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	174
04ced10e8804 gcc 7 kono parents: diff changeset	175 W := Shift_Left (W, 6) or (U and 2#00111111#);
04ced10e8804 gcc 7 kono parents: diff changeset	176 end Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	177
04ced10e8804 gcc 7 kono parents: diff changeset	178 -- Start of processing for UTF8 case
04ced10e8804 gcc 7 kono parents: diff changeset	179
04ced10e8804 gcc 7 kono parents: diff changeset	180 begin
04ced10e8804 gcc 7 kono parents: diff changeset	181 -- Note: for details of UTF8 encoding see RFC 3629
04ced10e8804 gcc 7 kono parents: diff changeset	182
04ced10e8804 gcc 7 kono parents: diff changeset	183 U := Unsigned_32 (Character'Pos (C));
04ced10e8804 gcc 7 kono parents: diff changeset	184
04ced10e8804 gcc 7 kono parents: diff changeset	185 -- 16#00_0000#-16#00_007F#: 0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	186
04ced10e8804 gcc 7 kono parents: diff changeset	187 if (U and 2#10000000#) = 2#00000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	188 Result := Wide_Wide_Character'Val (Character'Pos (C));
04ced10e8804 gcc 7 kono parents: diff changeset	189
04ced10e8804 gcc 7 kono parents: diff changeset	190 -- 16#00_0080#-16#00_07FF#: 110xxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	191
04ced10e8804 gcc 7 kono parents: diff changeset	192 elsif (U and 2#11100000#) = 2#110_00000# then
04ced10e8804 gcc 7 kono parents: diff changeset	193 W := U and 2#00011111#;
04ced10e8804 gcc 7 kono parents: diff changeset	194 Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	195
04ced10e8804 gcc 7 kono parents: diff changeset	196 if W not in 16#00_0080# .. 16#00_07FF# then
04ced10e8804 gcc 7 kono parents: diff changeset	197 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	198 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	199
04ced10e8804 gcc 7 kono parents: diff changeset	200 Result := Wide_Wide_Character'Val (W);
04ced10e8804 gcc 7 kono parents: diff changeset	201
04ced10e8804 gcc 7 kono parents: diff changeset	202 -- 16#00_0800#-16#00_ffff#: 1110xxxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	203
04ced10e8804 gcc 7 kono parents: diff changeset	204 elsif (U and 2#11110000#) = 2#1110_0000# then
04ced10e8804 gcc 7 kono parents: diff changeset	205 W := U and 2#00001111#;
04ced10e8804 gcc 7 kono parents: diff changeset	206 Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	207 Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	208
04ced10e8804 gcc 7 kono parents: diff changeset	209 if W not in 16#00_0800# .. 16#00_FFFF# then
04ced10e8804 gcc 7 kono parents: diff changeset	210 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	211 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	212
04ced10e8804 gcc 7 kono parents: diff changeset	213 Result := Wide_Wide_Character'Val (W);
04ced10e8804 gcc 7 kono parents: diff changeset	214
04ced10e8804 gcc 7 kono parents: diff changeset	215 -- 16#01_0000#-16#10_FFFF#: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	216
04ced10e8804 gcc 7 kono parents: diff changeset	217 elsif (U and 2#11111000#) = 2#11110_000# then
04ced10e8804 gcc 7 kono parents: diff changeset	218 W := U and 2#00000111#;
04ced10e8804 gcc 7 kono parents: diff changeset	219
04ced10e8804 gcc 7 kono parents: diff changeset	220 for K in 1 .. 3 loop
04ced10e8804 gcc 7 kono parents: diff changeset	221 Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	222 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	223
04ced10e8804 gcc 7 kono parents: diff changeset	224 if W not in 16#01_0000# .. 16#10_FFFF# then
04ced10e8804 gcc 7 kono parents: diff changeset	225 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	226 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	227
04ced10e8804 gcc 7 kono parents: diff changeset	228 Result := Wide_Wide_Character'Val (W);
04ced10e8804 gcc 7 kono parents: diff changeset	229
04ced10e8804 gcc 7 kono parents: diff changeset	230 -- 16#0020_0000#-16#03FF_FFFF#: 111110xx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	231 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	232
04ced10e8804 gcc 7 kono parents: diff changeset	233 elsif (U and 2#11111100#) = 2#111110_00# then
04ced10e8804 gcc 7 kono parents: diff changeset	234 W := U and 2#00000011#;
04ced10e8804 gcc 7 kono parents: diff changeset	235
04ced10e8804 gcc 7 kono parents: diff changeset	236 for K in 1 .. 4 loop
04ced10e8804 gcc 7 kono parents: diff changeset	237 Get_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	238 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	239
04ced10e8804 gcc 7 kono parents: diff changeset	240 if W not in 16#0020_0000# .. 16#03FF_FFFF# then
04ced10e8804 gcc 7 kono parents: diff changeset	241 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	242 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	243
04ced10e8804 gcc 7 kono parents: diff changeset	244 Result := Wide_Wide_Character'Val (W);
04ced10e8804 gcc 7 kono parents: diff changeset	245
04ced10e8804 gcc 7 kono parents: diff changeset	246 -- All other cases are invalid, note that this includes:
04ced10e8804 gcc 7 kono parents: diff changeset	247
04ced10e8804 gcc 7 kono parents: diff changeset	248 -- 16#0400_0000#-16#7FFF_FFFF#: 1111110x 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	249 -- 10xxxxxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	250
04ced10e8804 gcc 7 kono parents: diff changeset	251 -- since Wide_Wide_Character does not include code values
04ced10e8804 gcc 7 kono parents: diff changeset	252 -- greater than 16#03FF_FFFF#.
04ced10e8804 gcc 7 kono parents: diff changeset	253
04ced10e8804 gcc 7 kono parents: diff changeset	254 else
04ced10e8804 gcc 7 kono parents: diff changeset	255 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	256 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	257 end UTF8;
04ced10e8804 gcc 7 kono parents: diff changeset	258
04ced10e8804 gcc 7 kono parents: diff changeset	259 -- All encoding functions other than UTF-8
04ced10e8804 gcc 7 kono parents: diff changeset	260
04ced10e8804 gcc 7 kono parents: diff changeset	261 else
04ced10e8804 gcc 7 kono parents: diff changeset	262 Non_UTF8 : declare
04ced10e8804 gcc 7 kono parents: diff changeset	263 function Char_Sequence_To_UTF is
04ced10e8804 gcc 7 kono parents: diff changeset	264 new Char_Sequence_To_UTF_32 (In_Char);
04ced10e8804 gcc 7 kono parents: diff changeset	265
04ced10e8804 gcc 7 kono parents: diff changeset	266 begin
04ced10e8804 gcc 7 kono parents: diff changeset	267 -- For brackets, must test for specific case of [ not followed by
04ced10e8804 gcc 7 kono parents: diff changeset	268 -- quotation, where we must not call Char_Sequence_To_UTF, but
04ced10e8804 gcc 7 kono parents: diff changeset	269 -- instead just return the bracket unchanged.
04ced10e8804 gcc 7 kono parents: diff changeset	270
04ced10e8804 gcc 7 kono parents: diff changeset	271 if Encoding_Method = WCEM_Brackets
04ced10e8804 gcc 7 kono parents: diff changeset	272 and then C = '['
04ced10e8804 gcc 7 kono parents: diff changeset	273 and then (Ptr > Input'Last or else Input (Ptr) /= '"')
04ced10e8804 gcc 7 kono parents: diff changeset	274 then
04ced10e8804 gcc 7 kono parents: diff changeset	275 Result := '[';
04ced10e8804 gcc 7 kono parents: diff changeset	276
04ced10e8804 gcc 7 kono parents: diff changeset	277 -- All other cases including [" with Brackets
04ced10e8804 gcc 7 kono parents: diff changeset	278
04ced10e8804 gcc 7 kono parents: diff changeset	279 else
04ced10e8804 gcc 7 kono parents: diff changeset	280 Result :=
04ced10e8804 gcc 7 kono parents: diff changeset	281 Wide_Wide_Character'Val
04ced10e8804 gcc 7 kono parents: diff changeset	282 (Char_Sequence_To_UTF (C, Encoding_Method));
04ced10e8804 gcc 7 kono parents: diff changeset	283 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	284 end Non_UTF8;
04ced10e8804 gcc 7 kono parents: diff changeset	285 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	286 end Decode_Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	287
04ced10e8804 gcc 7 kono parents: diff changeset	288 -----------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	289 -- Decode_Wide_Wide_String --
04ced10e8804 gcc 7 kono parents: diff changeset	290 -----------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	291
04ced10e8804 gcc 7 kono parents: diff changeset	292 function Decode_Wide_Wide_String (S : String) return Wide_Wide_String is
04ced10e8804 gcc 7 kono parents: diff changeset	293 Result : Wide_Wide_String (1 .. S'Length);
04ced10e8804 gcc 7 kono parents: diff changeset	294 Length : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	295 begin
04ced10e8804 gcc 7 kono parents: diff changeset	296 Decode_Wide_Wide_String (S, Result, Length);
04ced10e8804 gcc 7 kono parents: diff changeset	297 return Result (1 .. Length);
04ced10e8804 gcc 7 kono parents: diff changeset	298 end Decode_Wide_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	299
04ced10e8804 gcc 7 kono parents: diff changeset	300 procedure Decode_Wide_Wide_String
04ced10e8804 gcc 7 kono parents: diff changeset	301 (S : String;
04ced10e8804 gcc 7 kono parents: diff changeset	302 Result : out Wide_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	303 Length : out Natural)
04ced10e8804 gcc 7 kono parents: diff changeset	304 is
04ced10e8804 gcc 7 kono parents: diff changeset	305 Ptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	306
04ced10e8804 gcc 7 kono parents: diff changeset	307 begin
04ced10e8804 gcc 7 kono parents: diff changeset	308 Ptr := S'First;
04ced10e8804 gcc 7 kono parents: diff changeset	309 Length := 0;
04ced10e8804 gcc 7 kono parents: diff changeset	310 while Ptr <= S'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	311 if Length >= Result'Last then
04ced10e8804 gcc 7 kono parents: diff changeset	312 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	313 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	314
04ced10e8804 gcc 7 kono parents: diff changeset	315 Length := Length + 1;
04ced10e8804 gcc 7 kono parents: diff changeset	316 Decode_Wide_Wide_Character (S, Ptr, Result (Length));
04ced10e8804 gcc 7 kono parents: diff changeset	317 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	318 end Decode_Wide_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	319
04ced10e8804 gcc 7 kono parents: diff changeset	320 -------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	321 -- Next_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	322 -------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	323
04ced10e8804 gcc 7 kono parents: diff changeset	324 procedure Next_Wide_Character (Input : String; Ptr : in out Natural) is
04ced10e8804 gcc 7 kono parents: diff changeset	325 Discard : Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	326 begin
04ced10e8804 gcc 7 kono parents: diff changeset	327 Decode_Wide_Character (Input, Ptr, Discard);
04ced10e8804 gcc 7 kono parents: diff changeset	328 end Next_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	329
04ced10e8804 gcc 7 kono parents: diff changeset	330 ------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	331 -- Next_Wide_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	332 ------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	333
04ced10e8804 gcc 7 kono parents: diff changeset	334 procedure Next_Wide_Wide_Character (Input : String; Ptr : in out Natural) is
04ced10e8804 gcc 7 kono parents: diff changeset	335 Discard : Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	336 begin
04ced10e8804 gcc 7 kono parents: diff changeset	337 Decode_Wide_Wide_Character (Input, Ptr, Discard);
04ced10e8804 gcc 7 kono parents: diff changeset	338 end Next_Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	339
04ced10e8804 gcc 7 kono parents: diff changeset	340 --------------
04ced10e8804 gcc 7 kono parents: diff changeset	341 -- Past_End --
04ced10e8804 gcc 7 kono parents: diff changeset	342 --------------
04ced10e8804 gcc 7 kono parents: diff changeset	343
04ced10e8804 gcc 7 kono parents: diff changeset	344 procedure Past_End is
04ced10e8804 gcc 7 kono parents: diff changeset	345 begin
04ced10e8804 gcc 7 kono parents: diff changeset	346 raise Constraint_Error with "past end of string";
04ced10e8804 gcc 7 kono parents: diff changeset	347 end Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	348
04ced10e8804 gcc 7 kono parents: diff changeset	349 -------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	350 -- Prev_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	351 -------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	352
04ced10e8804 gcc 7 kono parents: diff changeset	353 procedure Prev_Wide_Character (Input : String; Ptr : in out Natural) is
04ced10e8804 gcc 7 kono parents: diff changeset	354 begin
04ced10e8804 gcc 7 kono parents: diff changeset	355 if Ptr > Input'Last + 1 then
04ced10e8804 gcc 7 kono parents: diff changeset	356 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	357 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	358
04ced10e8804 gcc 7 kono parents: diff changeset	359 -- Special efficient encoding for UTF-8 case
04ced10e8804 gcc 7 kono parents: diff changeset	360
04ced10e8804 gcc 7 kono parents: diff changeset	361 if Encoding_Method = WCEM_UTF8 then
04ced10e8804 gcc 7 kono parents: diff changeset	362 UTF8 : declare
04ced10e8804 gcc 7 kono parents: diff changeset	363 U : Unsigned_32;
04ced10e8804 gcc 7 kono parents: diff changeset	364
04ced10e8804 gcc 7 kono parents: diff changeset	365 procedure Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	366 pragma Inline (Getc);
04ced10e8804 gcc 7 kono parents: diff changeset	367 -- Gets the character at Input (Ptr - 1) and returns code in U as
04ced10e8804 gcc 7 kono parents: diff changeset	368 -- Unsigned_32 value. On return Ptr is decremented by one.
04ced10e8804 gcc 7 kono parents: diff changeset	369
04ced10e8804 gcc 7 kono parents: diff changeset	370 procedure Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	371 pragma Inline (Skip_UTF_Byte);
04ced10e8804 gcc 7 kono parents: diff changeset	372 -- Checks that U is 2#10xxxxxx# and then calls Get
04ced10e8804 gcc 7 kono parents: diff changeset	373
04ced10e8804 gcc 7 kono parents: diff changeset	374 ----------
04ced10e8804 gcc 7 kono parents: diff changeset	375 -- Getc --
04ced10e8804 gcc 7 kono parents: diff changeset	376 ----------
04ced10e8804 gcc 7 kono parents: diff changeset	377
04ced10e8804 gcc 7 kono parents: diff changeset	378 procedure Getc is
04ced10e8804 gcc 7 kono parents: diff changeset	379 begin
04ced10e8804 gcc 7 kono parents: diff changeset	380 if Ptr <= Input'First then
04ced10e8804 gcc 7 kono parents: diff changeset	381 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	382 else
04ced10e8804 gcc 7 kono parents: diff changeset	383 Ptr := Ptr - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	384 U := Unsigned_32 (Character'Pos (Input (Ptr)));
04ced10e8804 gcc 7 kono parents: diff changeset	385 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	386 end Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	387
04ced10e8804 gcc 7 kono parents: diff changeset	388 -------------------
04ced10e8804 gcc 7 kono parents: diff changeset	389 -- Skip_UTF_Byte --
04ced10e8804 gcc 7 kono parents: diff changeset	390 -------------------
04ced10e8804 gcc 7 kono parents: diff changeset	391
04ced10e8804 gcc 7 kono parents: diff changeset	392 procedure Skip_UTF_Byte is
04ced10e8804 gcc 7 kono parents: diff changeset	393 begin
04ced10e8804 gcc 7 kono parents: diff changeset	394 if (U and 2#11000000#) = 2#10_000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	395 Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	396 else
04ced10e8804 gcc 7 kono parents: diff changeset	397 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	398 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	399 end Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	400
04ced10e8804 gcc 7 kono parents: diff changeset	401 -- Start of processing for UTF-8 case
04ced10e8804 gcc 7 kono parents: diff changeset	402
04ced10e8804 gcc 7 kono parents: diff changeset	403 begin
04ced10e8804 gcc 7 kono parents: diff changeset	404 -- 16#00_0000#-16#00_007F#: 0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	405
04ced10e8804 gcc 7 kono parents: diff changeset	406 Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	407
04ced10e8804 gcc 7 kono parents: diff changeset	408 if (U and 2#10000000#) = 2#00000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	409 return;
04ced10e8804 gcc 7 kono parents: diff changeset	410
04ced10e8804 gcc 7 kono parents: diff changeset	411 -- 16#00_0080#-16#00_07FF#: 110xxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	412
04ced10e8804 gcc 7 kono parents: diff changeset	413 else
04ced10e8804 gcc 7 kono parents: diff changeset	414 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	415
04ced10e8804 gcc 7 kono parents: diff changeset	416 if (U and 2#11100000#) = 2#110_00000# then
04ced10e8804 gcc 7 kono parents: diff changeset	417 return;
04ced10e8804 gcc 7 kono parents: diff changeset	418
04ced10e8804 gcc 7 kono parents: diff changeset	419 -- 16#00_0800#-16#00_ffff#: 1110xxxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	420
04ced10e8804 gcc 7 kono parents: diff changeset	421 else
04ced10e8804 gcc 7 kono parents: diff changeset	422 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	423
04ced10e8804 gcc 7 kono parents: diff changeset	424 if (U and 2#11110000#) = 2#1110_0000# then
04ced10e8804 gcc 7 kono parents: diff changeset	425 return;
04ced10e8804 gcc 7 kono parents: diff changeset	426
04ced10e8804 gcc 7 kono parents: diff changeset	427 -- Any other code is invalid, note that this includes:
04ced10e8804 gcc 7 kono parents: diff changeset	428
04ced10e8804 gcc 7 kono parents: diff changeset	429 -- 16#01_0000#-16#10_FFFF#: 11110xxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	430 -- 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	431
04ced10e8804 gcc 7 kono parents: diff changeset	432 -- 16#0020_0000#-16#03FF_FFFF#: 111110xx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	433 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	434 -- 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	435
04ced10e8804 gcc 7 kono parents: diff changeset	436 -- 16#0400_0000#-16#7FFF_FFFF#: 1111110x 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	437 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	438 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	439
04ced10e8804 gcc 7 kono parents: diff changeset	440 -- since Wide_Character does not allow codes > 16#FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	441
04ced10e8804 gcc 7 kono parents: diff changeset	442 else
04ced10e8804 gcc 7 kono parents: diff changeset	443 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	444 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	445 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	446 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	447 end UTF8;
04ced10e8804 gcc 7 kono parents: diff changeset	448
04ced10e8804 gcc 7 kono parents: diff changeset	449 -- Special efficient encoding for brackets case
04ced10e8804 gcc 7 kono parents: diff changeset	450
04ced10e8804 gcc 7 kono parents: diff changeset	451 elsif Encoding_Method = WCEM_Brackets then
04ced10e8804 gcc 7 kono parents: diff changeset	452 Brackets : declare
04ced10e8804 gcc 7 kono parents: diff changeset	453 P : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	454 S : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	455
04ced10e8804 gcc 7 kono parents: diff changeset	456 begin
04ced10e8804 gcc 7 kono parents: diff changeset	457 -- See if we have "] at end positions
04ced10e8804 gcc 7 kono parents: diff changeset	458
04ced10e8804 gcc 7 kono parents: diff changeset	459 if Ptr > Input'First + 1
04ced10e8804 gcc 7 kono parents: diff changeset	460 and then Input (Ptr - 1) = ']'
04ced10e8804 gcc 7 kono parents: diff changeset	461 and then Input (Ptr - 2) = '"'
04ced10e8804 gcc 7 kono parents: diff changeset	462 then
04ced10e8804 gcc 7 kono parents: diff changeset	463 P := Ptr - 2;
04ced10e8804 gcc 7 kono parents: diff changeset	464
04ced10e8804 gcc 7 kono parents: diff changeset	465 -- Loop back looking for [" at start
04ced10e8804 gcc 7 kono parents: diff changeset	466
04ced10e8804 gcc 7 kono parents: diff changeset	467 while P >= Ptr - 10 loop
04ced10e8804 gcc 7 kono parents: diff changeset	468 if P <= Input'First + 1 then
04ced10e8804 gcc 7 kono parents: diff changeset	469 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	470
04ced10e8804 gcc 7 kono parents: diff changeset	471 elsif Input (P - 1) = '"'
04ced10e8804 gcc 7 kono parents: diff changeset	472 and then Input (P - 2) = '['
04ced10e8804 gcc 7 kono parents: diff changeset	473 then
04ced10e8804 gcc 7 kono parents: diff changeset	474 -- Found ["..."], scan forward to check it
04ced10e8804 gcc 7 kono parents: diff changeset	475
04ced10e8804 gcc 7 kono parents: diff changeset	476 S := P - 2;
04ced10e8804 gcc 7 kono parents: diff changeset	477 P := S;
04ced10e8804 gcc 7 kono parents: diff changeset	478 Next_Wide_Character (Input, P);
04ced10e8804 gcc 7 kono parents: diff changeset	479
04ced10e8804 gcc 7 kono parents: diff changeset	480 -- OK if at original pointer, else error
04ced10e8804 gcc 7 kono parents: diff changeset	481
04ced10e8804 gcc 7 kono parents: diff changeset	482 if P = Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	483 Ptr := S;
04ced10e8804 gcc 7 kono parents: diff changeset	484 return;
04ced10e8804 gcc 7 kono parents: diff changeset	485 else
04ced10e8804 gcc 7 kono parents: diff changeset	486 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	487 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	488 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	489
04ced10e8804 gcc 7 kono parents: diff changeset	490 P := P - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	491 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	492
04ced10e8804 gcc 7 kono parents: diff changeset	493 -- Falling through loop means more than 8 chars between the
04ced10e8804 gcc 7 kono parents: diff changeset	494 -- enclosing brackets (or simply a missing left bracket)
04ced10e8804 gcc 7 kono parents: diff changeset	495
04ced10e8804 gcc 7 kono parents: diff changeset	496 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	497
04ced10e8804 gcc 7 kono parents: diff changeset	498 -- Here if no bracket sequence present
04ced10e8804 gcc 7 kono parents: diff changeset	499
04ced10e8804 gcc 7 kono parents: diff changeset	500 else
04ced10e8804 gcc 7 kono parents: diff changeset	501 if Ptr = Input'First then
04ced10e8804 gcc 7 kono parents: diff changeset	502 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	503 else
04ced10e8804 gcc 7 kono parents: diff changeset	504 Ptr := Ptr - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	505 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	506 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	507 end Brackets;
04ced10e8804 gcc 7 kono parents: diff changeset	508
04ced10e8804 gcc 7 kono parents: diff changeset	509 -- Non-UTF-8/Brackets. These are the inefficient cases where we have to
04ced10e8804 gcc 7 kono parents: diff changeset	510 -- go to the start of the string and skip forwards till Ptr matches.
04ced10e8804 gcc 7 kono parents: diff changeset	511
04ced10e8804 gcc 7 kono parents: diff changeset	512 else
04ced10e8804 gcc 7 kono parents: diff changeset	513 Non_UTF_Brackets : declare
04ced10e8804 gcc 7 kono parents: diff changeset	514 Discard : Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	515 PtrS : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	516 PtrP : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	517
04ced10e8804 gcc 7 kono parents: diff changeset	518 begin
04ced10e8804 gcc 7 kono parents: diff changeset	519 PtrS := Input'First;
04ced10e8804 gcc 7 kono parents: diff changeset	520
04ced10e8804 gcc 7 kono parents: diff changeset	521 if Ptr <= PtrS then
04ced10e8804 gcc 7 kono parents: diff changeset	522 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	523 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	524
04ced10e8804 gcc 7 kono parents: diff changeset	525 loop
04ced10e8804 gcc 7 kono parents: diff changeset	526 PtrP := PtrS;
04ced10e8804 gcc 7 kono parents: diff changeset	527 Decode_Wide_Character (Input, PtrS, Discard);
04ced10e8804 gcc 7 kono parents: diff changeset	528
04ced10e8804 gcc 7 kono parents: diff changeset	529 if PtrS = Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	530 Ptr := PtrP;
04ced10e8804 gcc 7 kono parents: diff changeset	531 return;
04ced10e8804 gcc 7 kono parents: diff changeset	532
04ced10e8804 gcc 7 kono parents: diff changeset	533 elsif PtrS > Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	534 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	535 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	536 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	537
04ced10e8804 gcc 7 kono parents: diff changeset	538 exception
04ced10e8804 gcc 7 kono parents: diff changeset	539 when Constraint_Error =>
04ced10e8804 gcc 7 kono parents: diff changeset	540 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	541 end Non_UTF_Brackets;
04ced10e8804 gcc 7 kono parents: diff changeset	542 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	543 end Prev_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	544
04ced10e8804 gcc 7 kono parents: diff changeset	545 ------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	546 -- Prev_Wide_Wide_Character --
04ced10e8804 gcc 7 kono parents: diff changeset	547 ------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	548
04ced10e8804 gcc 7 kono parents: diff changeset	549 procedure Prev_Wide_Wide_Character (Input : String; Ptr : in out Natural) is
04ced10e8804 gcc 7 kono parents: diff changeset	550 begin
04ced10e8804 gcc 7 kono parents: diff changeset	551 if Ptr > Input'Last + 1 then
04ced10e8804 gcc 7 kono parents: diff changeset	552 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	553 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	554
04ced10e8804 gcc 7 kono parents: diff changeset	555 -- Special efficient encoding for UTF-8 case
04ced10e8804 gcc 7 kono parents: diff changeset	556
04ced10e8804 gcc 7 kono parents: diff changeset	557 if Encoding_Method = WCEM_UTF8 then
04ced10e8804 gcc 7 kono parents: diff changeset	558 UTF8 : declare
04ced10e8804 gcc 7 kono parents: diff changeset	559 U : Unsigned_32;
04ced10e8804 gcc 7 kono parents: diff changeset	560
04ced10e8804 gcc 7 kono parents: diff changeset	561 procedure Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	562 pragma Inline (Getc);
04ced10e8804 gcc 7 kono parents: diff changeset	563 -- Gets the character at Input (Ptr - 1) and returns code in U as
04ced10e8804 gcc 7 kono parents: diff changeset	564 -- Unsigned_32 value. On return Ptr is decremented by one.
04ced10e8804 gcc 7 kono parents: diff changeset	565
04ced10e8804 gcc 7 kono parents: diff changeset	566 procedure Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	567 pragma Inline (Skip_UTF_Byte);
04ced10e8804 gcc 7 kono parents: diff changeset	568 -- Checks that U is 2#10xxxxxx# and then calls Get
04ced10e8804 gcc 7 kono parents: diff changeset	569
04ced10e8804 gcc 7 kono parents: diff changeset	570 ----------
04ced10e8804 gcc 7 kono parents: diff changeset	571 -- Getc --
04ced10e8804 gcc 7 kono parents: diff changeset	572 ----------
04ced10e8804 gcc 7 kono parents: diff changeset	573
04ced10e8804 gcc 7 kono parents: diff changeset	574 procedure Getc is
04ced10e8804 gcc 7 kono parents: diff changeset	575 begin
04ced10e8804 gcc 7 kono parents: diff changeset	576 if Ptr <= Input'First then
04ced10e8804 gcc 7 kono parents: diff changeset	577 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	578 else
04ced10e8804 gcc 7 kono parents: diff changeset	579 Ptr := Ptr - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	580 U := Unsigned_32 (Character'Pos (Input (Ptr)));
04ced10e8804 gcc 7 kono parents: diff changeset	581 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	582 end Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	583
04ced10e8804 gcc 7 kono parents: diff changeset	584 -------------------
04ced10e8804 gcc 7 kono parents: diff changeset	585 -- Skip_UTF_Byte --
04ced10e8804 gcc 7 kono parents: diff changeset	586 -------------------
04ced10e8804 gcc 7 kono parents: diff changeset	587
04ced10e8804 gcc 7 kono parents: diff changeset	588 procedure Skip_UTF_Byte is
04ced10e8804 gcc 7 kono parents: diff changeset	589 begin
04ced10e8804 gcc 7 kono parents: diff changeset	590 if (U and 2#11000000#) = 2#10_000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	591 Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	592 else
04ced10e8804 gcc 7 kono parents: diff changeset	593 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	594 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	595 end Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	596
04ced10e8804 gcc 7 kono parents: diff changeset	597 -- Start of processing for UTF-8 case
04ced10e8804 gcc 7 kono parents: diff changeset	598
04ced10e8804 gcc 7 kono parents: diff changeset	599 begin
04ced10e8804 gcc 7 kono parents: diff changeset	600 -- 16#00_0000#-16#00_007F#: 0xxxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	601
04ced10e8804 gcc 7 kono parents: diff changeset	602 Getc;
04ced10e8804 gcc 7 kono parents: diff changeset	603
04ced10e8804 gcc 7 kono parents: diff changeset	604 if (U and 2#10000000#) = 2#00000000# then
04ced10e8804 gcc 7 kono parents: diff changeset	605 return;
04ced10e8804 gcc 7 kono parents: diff changeset	606
04ced10e8804 gcc 7 kono parents: diff changeset	607 -- 16#00_0080#-16#00_07FF#: 110xxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	608
04ced10e8804 gcc 7 kono parents: diff changeset	609 else
04ced10e8804 gcc 7 kono parents: diff changeset	610 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	611
04ced10e8804 gcc 7 kono parents: diff changeset	612 if (U and 2#11100000#) = 2#110_00000# then
04ced10e8804 gcc 7 kono parents: diff changeset	613 return;
04ced10e8804 gcc 7 kono parents: diff changeset	614
04ced10e8804 gcc 7 kono parents: diff changeset	615 -- 16#00_0800#-16#00_ffff#: 1110xxxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	616
04ced10e8804 gcc 7 kono parents: diff changeset	617 else
04ced10e8804 gcc 7 kono parents: diff changeset	618 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	619
04ced10e8804 gcc 7 kono parents: diff changeset	620 if (U and 2#11110000#) = 2#1110_0000# then
04ced10e8804 gcc 7 kono parents: diff changeset	621 return;
04ced10e8804 gcc 7 kono parents: diff changeset	622
04ced10e8804 gcc 7 kono parents: diff changeset	623 -- 16#01_0000#-16#10_FFFF#: 11110xxx 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	624 -- 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	625
04ced10e8804 gcc 7 kono parents: diff changeset	626 else
04ced10e8804 gcc 7 kono parents: diff changeset	627 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	628
04ced10e8804 gcc 7 kono parents: diff changeset	629 if (U and 2#11111000#) = 2#11110_000# then
04ced10e8804 gcc 7 kono parents: diff changeset	630 return;
04ced10e8804 gcc 7 kono parents: diff changeset	631
04ced10e8804 gcc 7 kono parents: diff changeset	632 -- 16#0020_0000#-16#03FF_FFFF#: 111110xx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	633 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	634 -- 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	635
04ced10e8804 gcc 7 kono parents: diff changeset	636 else
04ced10e8804 gcc 7 kono parents: diff changeset	637 Skip_UTF_Byte;
04ced10e8804 gcc 7 kono parents: diff changeset	638
04ced10e8804 gcc 7 kono parents: diff changeset	639 if (U and 2#11111100#) = 2#111110_00# then
04ced10e8804 gcc 7 kono parents: diff changeset	640 return;
04ced10e8804 gcc 7 kono parents: diff changeset	641
04ced10e8804 gcc 7 kono parents: diff changeset	642 -- Any other code is invalid, note that this includes:
04ced10e8804 gcc 7 kono parents: diff changeset	643
04ced10e8804 gcc 7 kono parents: diff changeset	644 -- 16#0400_0000#-16#7FFF_FFFF#: 1111110x 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	645 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	646 -- 10xxxxxx 10xxxxxx
04ced10e8804 gcc 7 kono parents: diff changeset	647
04ced10e8804 gcc 7 kono parents: diff changeset	648 -- since Wide_Wide_Character does not allow codes
04ced10e8804 gcc 7 kono parents: diff changeset	649 -- greater than 16#03FF_FFFF#
04ced10e8804 gcc 7 kono parents: diff changeset	650
04ced10e8804 gcc 7 kono parents: diff changeset	651 else
04ced10e8804 gcc 7 kono parents: diff changeset	652 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	653 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	654 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	655 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	656 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	657 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	658 end UTF8;
04ced10e8804 gcc 7 kono parents: diff changeset	659
04ced10e8804 gcc 7 kono parents: diff changeset	660 -- Special efficient encoding for brackets case
04ced10e8804 gcc 7 kono parents: diff changeset	661
04ced10e8804 gcc 7 kono parents: diff changeset	662 elsif Encoding_Method = WCEM_Brackets then
04ced10e8804 gcc 7 kono parents: diff changeset	663 Brackets : declare
04ced10e8804 gcc 7 kono parents: diff changeset	664 P : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	665 S : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	666
04ced10e8804 gcc 7 kono parents: diff changeset	667 begin
04ced10e8804 gcc 7 kono parents: diff changeset	668 -- See if we have "] at end positions
04ced10e8804 gcc 7 kono parents: diff changeset	669
04ced10e8804 gcc 7 kono parents: diff changeset	670 if Ptr > Input'First + 1
04ced10e8804 gcc 7 kono parents: diff changeset	671 and then Input (Ptr - 1) = ']'
04ced10e8804 gcc 7 kono parents: diff changeset	672 and then Input (Ptr - 2) = '"'
04ced10e8804 gcc 7 kono parents: diff changeset	673 then
04ced10e8804 gcc 7 kono parents: diff changeset	674 P := Ptr - 2;
04ced10e8804 gcc 7 kono parents: diff changeset	675
04ced10e8804 gcc 7 kono parents: diff changeset	676 -- Loop back looking for [" at start
04ced10e8804 gcc 7 kono parents: diff changeset	677
04ced10e8804 gcc 7 kono parents: diff changeset	678 while P >= Ptr - 10 loop
04ced10e8804 gcc 7 kono parents: diff changeset	679 if P <= Input'First + 1 then
04ced10e8804 gcc 7 kono parents: diff changeset	680 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	681
04ced10e8804 gcc 7 kono parents: diff changeset	682 elsif Input (P - 1) = '"'
04ced10e8804 gcc 7 kono parents: diff changeset	683 and then Input (P - 2) = '['
04ced10e8804 gcc 7 kono parents: diff changeset	684 then
04ced10e8804 gcc 7 kono parents: diff changeset	685 -- Found ["..."], scan forward to check it
04ced10e8804 gcc 7 kono parents: diff changeset	686
04ced10e8804 gcc 7 kono parents: diff changeset	687 S := P - 2;
04ced10e8804 gcc 7 kono parents: diff changeset	688 P := S;
04ced10e8804 gcc 7 kono parents: diff changeset	689 Next_Wide_Wide_Character (Input, P);
04ced10e8804 gcc 7 kono parents: diff changeset	690
04ced10e8804 gcc 7 kono parents: diff changeset	691 -- OK if at original pointer, else error
04ced10e8804 gcc 7 kono parents: diff changeset	692
04ced10e8804 gcc 7 kono parents: diff changeset	693 if P = Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	694 Ptr := S;
04ced10e8804 gcc 7 kono parents: diff changeset	695 return;
04ced10e8804 gcc 7 kono parents: diff changeset	696 else
04ced10e8804 gcc 7 kono parents: diff changeset	697 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	698 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	699 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	700
04ced10e8804 gcc 7 kono parents: diff changeset	701 P := P - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	702 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	703
04ced10e8804 gcc 7 kono parents: diff changeset	704 -- Falling through loop means more than 8 chars between the
04ced10e8804 gcc 7 kono parents: diff changeset	705 -- enclosing brackets (or simply a missing left bracket)
04ced10e8804 gcc 7 kono parents: diff changeset	706
04ced10e8804 gcc 7 kono parents: diff changeset	707 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	708
04ced10e8804 gcc 7 kono parents: diff changeset	709 -- Here if no bracket sequence present
04ced10e8804 gcc 7 kono parents: diff changeset	710
04ced10e8804 gcc 7 kono parents: diff changeset	711 else
04ced10e8804 gcc 7 kono parents: diff changeset	712 if Ptr = Input'First then
04ced10e8804 gcc 7 kono parents: diff changeset	713 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	714 else
04ced10e8804 gcc 7 kono parents: diff changeset	715 Ptr := Ptr - 1;
04ced10e8804 gcc 7 kono parents: diff changeset	716 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	717 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	718 end Brackets;
04ced10e8804 gcc 7 kono parents: diff changeset	719
04ced10e8804 gcc 7 kono parents: diff changeset	720 -- Non-UTF-8/Brackets. These are the inefficient cases where we have to
04ced10e8804 gcc 7 kono parents: diff changeset	721 -- go to the start of the string and skip forwards till Ptr matches.
04ced10e8804 gcc 7 kono parents: diff changeset	722
04ced10e8804 gcc 7 kono parents: diff changeset	723 else
04ced10e8804 gcc 7 kono parents: diff changeset	724 Non_UTF8_Brackets : declare
04ced10e8804 gcc 7 kono parents: diff changeset	725 Discard : Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	726 PtrS : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	727 PtrP : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	728
04ced10e8804 gcc 7 kono parents: diff changeset	729 begin
04ced10e8804 gcc 7 kono parents: diff changeset	730 PtrS := Input'First;
04ced10e8804 gcc 7 kono parents: diff changeset	731
04ced10e8804 gcc 7 kono parents: diff changeset	732 if Ptr <= PtrS then
04ced10e8804 gcc 7 kono parents: diff changeset	733 Past_End;
04ced10e8804 gcc 7 kono parents: diff changeset	734 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	735
04ced10e8804 gcc 7 kono parents: diff changeset	736 loop
04ced10e8804 gcc 7 kono parents: diff changeset	737 PtrP := PtrS;
04ced10e8804 gcc 7 kono parents: diff changeset	738 Decode_Wide_Wide_Character (Input, PtrS, Discard);
04ced10e8804 gcc 7 kono parents: diff changeset	739
04ced10e8804 gcc 7 kono parents: diff changeset	740 if PtrS = Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	741 Ptr := PtrP;
04ced10e8804 gcc 7 kono parents: diff changeset	742 return;
04ced10e8804 gcc 7 kono parents: diff changeset	743
04ced10e8804 gcc 7 kono parents: diff changeset	744 elsif PtrS > Ptr then
04ced10e8804 gcc 7 kono parents: diff changeset	745 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	746 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	747 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	748
04ced10e8804 gcc 7 kono parents: diff changeset	749 exception
04ced10e8804 gcc 7 kono parents: diff changeset	750 when Constraint_Error =>
04ced10e8804 gcc 7 kono parents: diff changeset	751 Bad;
04ced10e8804 gcc 7 kono parents: diff changeset	752 end Non_UTF8_Brackets;
04ced10e8804 gcc 7 kono parents: diff changeset	753 end if;
04ced10e8804 gcc 7 kono parents: diff changeset	754 end Prev_Wide_Wide_Character;
04ced10e8804 gcc 7 kono parents: diff changeset	755
04ced10e8804 gcc 7 kono parents: diff changeset	756 --------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	757 -- Validate_Wide_String --
04ced10e8804 gcc 7 kono parents: diff changeset	758 --------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	759
04ced10e8804 gcc 7 kono parents: diff changeset	760 function Validate_Wide_String (S : String) return Boolean is
04ced10e8804 gcc 7 kono parents: diff changeset	761 Ptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	762
04ced10e8804 gcc 7 kono parents: diff changeset	763 begin
04ced10e8804 gcc 7 kono parents: diff changeset	764 Ptr := S'First;
04ced10e8804 gcc 7 kono parents: diff changeset	765 while Ptr <= S'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	766 Next_Wide_Character (S, Ptr);
04ced10e8804 gcc 7 kono parents: diff changeset	767 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	768
04ced10e8804 gcc 7 kono parents: diff changeset	769 return True;
04ced10e8804 gcc 7 kono parents: diff changeset	770
04ced10e8804 gcc 7 kono parents: diff changeset	771 exception
04ced10e8804 gcc 7 kono parents: diff changeset	772 when Constraint_Error =>
04ced10e8804 gcc 7 kono parents: diff changeset	773 return False;
04ced10e8804 gcc 7 kono parents: diff changeset	774 end Validate_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	775
04ced10e8804 gcc 7 kono parents: diff changeset	776 -------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	777 -- Validate_Wide_Wide_String --
04ced10e8804 gcc 7 kono parents: diff changeset	778 -------------------------------
04ced10e8804 gcc 7 kono parents: diff changeset	779
04ced10e8804 gcc 7 kono parents: diff changeset	780 function Validate_Wide_Wide_String (S : String) return Boolean is
04ced10e8804 gcc 7 kono parents: diff changeset	781 Ptr : Natural;
04ced10e8804 gcc 7 kono parents: diff changeset	782
04ced10e8804 gcc 7 kono parents: diff changeset	783 begin
04ced10e8804 gcc 7 kono parents: diff changeset	784 Ptr := S'First;
04ced10e8804 gcc 7 kono parents: diff changeset	785 while Ptr <= S'Last loop
04ced10e8804 gcc 7 kono parents: diff changeset	786 Next_Wide_Wide_Character (S, Ptr);
04ced10e8804 gcc 7 kono parents: diff changeset	787 end loop;
04ced10e8804 gcc 7 kono parents: diff changeset	788
04ced10e8804 gcc 7 kono parents: diff changeset	789 return True;
04ced10e8804 gcc 7 kono parents: diff changeset	790
04ced10e8804 gcc 7 kono parents: diff changeset	791 exception
04ced10e8804 gcc 7 kono parents: diff changeset	792 when Constraint_Error =>
04ced10e8804 gcc 7 kono parents: diff changeset	793 return False;
04ced10e8804 gcc 7 kono parents: diff changeset	794 end Validate_Wide_Wide_String;
04ced10e8804 gcc 7 kono parents: diff changeset	795
04ced10e8804 gcc 7 kono parents: diff changeset	796 end GNAT.Decode_String;

Mercurial > hg > CbC > CbC_gcc

annotate gcc/ada/libgnat/g-decstr.adb @ 131:84e7813d76e9