成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

UTF-8 Validation

Kahn / 3542人閱讀

摘要:題目鏈接這道題關(guān)鍵是搞懂題目意思。思路及代碼知道意思之后,這道題就很簡(jiǎn)單了。一個(gè),每次分三步來(lái)做,是每次都是新的統(tǒng)計(jì)后位里面,從前開始有多少個(gè),用變量來(lái)保存,其中可能的值只有從開始檢查,后八位中的前兩位是否為,一共檢查更新的值為

UTF-8 Validation

題目鏈接:https://leetcode.com/problems...

這道題關(guān)鍵是搞懂題目意思。

UTF-8

1 byte: characters from 0 to 127 == ASCII
2 bytes: characters from 127 to 2047
3 bytes: characters from 2048 to 65535
4 bytes: characters from 65536 to 1112064

The leading bits tell: the length of the bytes

1 byte: the 1st bit is 0

2 bytes:

1st byte: start with "110"

2nd byte: start with "10"

3 bytes:

1st byte: start with "1110"

2nd byte: start with "10"

3rd byte: start with "10"

4 bytes:

1st byte: start with "11110"

2nd byte: start with "10"

3rd byte: start with "10"

4th byte: start with "10"

思路及代碼

知道意思之后,這道題就很簡(jiǎn)單了。
一個(gè)loop,每次分三步來(lái)做,loop invariant是每次data[i]都是first byte of 新的character

統(tǒng)計(jì)data[i]后8位里面,從前開始有多少個(gè)1,用變量ones來(lái)保存,其中ones可能的值只有0, 2, 3, 4

從 data[i+1] 開始檢查,后八位中的前兩位是否為"10",一共檢查ones - 1

更新i的值為 i + ones

public class Solution {
    public boolean validUtf8(int[] data) {
        /* 1. check how many "1"s = ones
         * 2. check (i + 1, i + ones - 1) for "10"
         * 3. update i = i + ones
         * valid ones: 0, 2, 3, 4
         */
        int i = 0;
        while(i < data.length) {
            // 1. find ones
            int ones = 0;
            while(((data[i] >> (7 - ones)) & 1) == 1) {
                ones++;
            }
            // invalid ones 
            if(ones == 1 || ones > 4) return false;
            // 2. check 1s
            i++;
            while(ones-- > 1) {
                if(i >= data.length || ((data[i] >> 6) & 3) != 2) return false;
                // 3. update i
                i++;
            }
        }
        
        return true;
    }
}

Advantage of UTF-8

implement Unicode: encode different symbols(Chinese...)

web pages are often coded in UTF-8, XML, JSON

only use binary representation: 0 and 1

endianness independent

Disadvantage of UTF-8

space: use more bytes, larger

time: calculate

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/66554.html

相關(guān)文章

  • [LintCode] UTF-8 Validation

    Problem A character in UTF8 can be from 1 to 4 bytes long, subjected to the following rules: For 1-byte character, the first bit is a 0, followed by its unicode code.For n-bytes character, the first n...

    tolerious 評(píng)論0 收藏0
  • leetcode393. UTF-8 Validation

    摘要:題目要求檢驗(yàn)整數(shù)數(shù)組能否構(gòu)成合法的編碼的序列。剩余的字節(jié)必須以開頭。而緊跟其后的字符必須格式為。綜上所述單字節(jié)多字節(jié)字符的跟隨字節(jié)兩個(gè)字節(jié)的起始字節(jié)三個(gè)字節(jié)的起始字節(jié)四個(gè)字節(jié)的起始字節(jié)下面分別是這題的兩種實(shí)現(xiàn)遞歸實(shí)現(xiàn)循環(huán)實(shí)現(xiàn) 題目要求 A character in UTF8 can be from 1 to 4 bytes long, subjected to the followin...

    Cruise_Chan 評(píng)論0 收藏0
  • 記錄_使用JSR303規(guī)范進(jìn)行數(shù)據(jù)校驗(yàn)

    摘要:時(shí)間年月日星期三說(shuō)明使用規(guī)范校驗(yàn)接口請(qǐng)求參數(shù)源碼第一章理論簡(jiǎn)介背景介紹如今互聯(lián)網(wǎng)項(xiàng)目都采用接口形式進(jìn)行開發(fā)。該規(guī)范定義了一個(gè)元數(shù)據(jù)模型,默認(rèn)的元數(shù)據(jù)來(lái)源是注解。 時(shí)間:2017年11月08日星期三說(shuō)明:使用JSR303規(guī)范校驗(yàn)http接口請(qǐng)求參數(shù) 源碼:https://github.com/zccodere/s... 第一章:理論簡(jiǎn)介 1-1 背景介紹 如今互聯(lián)網(wǎng)項(xiàng)目都采用HTTP接口...

    187J3X1 評(píng)論0 收藏0
  • Bean Validation完結(jié)篇:你必須關(guān)注的邊邊角角(約束級(jí)聯(lián)、自定義約束、自定義校驗(yàn)器、國(guó)際

    摘要:和上標(biāo)注的約束都會(huì)被執(zhí)行注意如果子類覆蓋了父類的方法,那么子類和父類的約束都會(huì)被校驗(yàn)。 每篇一句 沒(méi)有任何技術(shù)方案會(huì)是一種銀彈,任何東西都是有利弊的 相關(guān)閱讀 【小家Java】深入了解數(shù)據(jù)校驗(yàn):Java Bean Validation 2.0(JSR303、JSR349、JSR380)Hibernate-Validation 6.x使用案例【小家Spring】Spring方法級(jí)別數(shù)據(jù)校...

    niuxiaowei111 評(píng)論0 收藏0
  • eclipse定制化配置調(diào)優(yōu)、初始化配置指南、可以解決啟動(dòng)慢等問(wèn)題

    摘要:配置的參數(shù)打開根目錄下的在最后面加上如下的參數(shù)測(cè)試環(huán)境位內(nèi)存雙核測(cè)試版本經(jīng)測(cè)試,啟動(dòng)速度比默認(rèn)配置有所提升,占用內(nèi)存也較少其中這三行為啟用方式,不能保證在不同環(huán)境下都是最優(yōu)配置,可以替換為多核和大內(nèi)存建議使 配置eclipse的jvm參數(shù) 打開eclipse根目錄下的eclipse.ini在最后面加上如下的jvm參數(shù) -Xms400m -Xmx1400m -XX:NewSize=128...

    Warren 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<