From c5a098422578236d3def4c2f9b42a508baeb0c0a Mon Sep 17 00:00:00 2001
From: RF-Tar-Railt <3165388245@qq.com>
Date: Mon, 19 Feb 2024 20:35:01 +0800
Subject: [PATCH] :sparkles: update element.py

---
 .gitignore                         |   2 +-
 nonebot/adapters/satori/element.py | 406 +++++++++++++++++++++++++++++
 nonebot/adapters/satori/event.py   |  13 +-
 nonebot/adapters/satori/message.py |   2 +-
 nonebot/adapters/satori/models.py  |  14 +-
 nonebot/adapters/satori/utils.py   | 136 +---------
 6 files changed, 418 insertions(+), 155 deletions(-)
 create mode 100644 nonebot/adapters/satori/element.py

diff --git a/.gitignore b/.gitignore
index 4b3ab30..685eeb5 100644
--- a/.gitignore
+++ b/.gitignore
@@ -159,4 +159,4 @@ cython_debug/
 #  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
 #  and can be added to the global gitignore or merged into this file.  For a more nuclear
 #  option (not recommended) you can uncomment the following to ignore the entire idea folder.
-#.idea/
+.idea/
diff --git a/nonebot/adapters/satori/element.py b/nonebot/adapters/satori/element.py
new file mode 100644
index 0000000..6c769f6
--- /dev/null
+++ b/nonebot/adapters/satori/element.py
@@ -0,0 +1,406 @@
+import re
+from enum import IntEnum
+from typing_extensions import TypeAlias
+from dataclasses import field, dataclass
+from typing import Any, Dict, List, Union, Literal, TypeVar, Callable, Iterable, Optional, TypedDict, cast
+
+T = TypeVar("T")
+
+
+def escape(text: str, inline: bool = False) -> str:
+    result = text.replace("&", "&amp;").replace("<", "&lt;").replace(">", "&gt;")
+    return result.replace('"', "&quot;") if inline else result
+
+
+def unescape(text: str) -> str:
+    result = text.replace("&lt;", "<").replace("&gt;", ">").replace("&quot;", '"')
+    result = re.sub(r"&#(\d+);", lambda m: m[0] if m[1] == "38" else chr(int(m[1])), result)
+    result = re.sub(r"&#x([0-9a-f]+);", lambda m: m[0] if m[1] == "26" else chr(int(m[1], 16)), result)
+    return re.sub("&(amp|#38|#x26);", "&", result)
+
+
+def uncapitalize(source: str) -> str:
+    return source[0].lower() + source[1:]
+
+
+def camel_case(source: str) -> str:
+    return re.sub("[_-][a-z]", lambda mat: mat[0][1:].upper(), source)
+
+
+def param_case(source: str) -> str:
+    return re.sub(
+        ".[A-Z]+", lambda mat: mat[0][0] + "-" + mat[0][1:].lower(), uncapitalize(source).replace("_", "-")
+    )
+
+
+def snake_case(source: str) -> str:
+    return re.sub(
+        ".[A-Z]", lambda mat: mat[0][0] + "_" + mat[0][1:].lower(), uncapitalize(source).replace("-", "_")
+    )
+
+
+def ensure_list(value: Union[T, List[T], None]) -> List[T]:
+    return value if isinstance(value, list) else [value] if value else []
+
+
+S = TypeVar("S")
+Fragment: TypeAlias = Union[str, "Element", List[Union[str, "Element"]]]
+Render: TypeAlias = Callable[[dict, List["Element"], S], T]
+Visitor: TypeAlias = Callable[["Element", S], T]
+
+
+def make_element(content: Union[str, bool, int, float, "Element"]) -> Optional["Element"]:
+    if isinstance(content, Element):
+        return content
+    if isinstance(content, (bool, int, float)):
+        return Element(type="text", attrs={"text": str(content)})
+    if isinstance(content, str) and content:
+        return Element(type="text", attrs={"text": content})
+    if content is not None:
+        raise ValueError(f"Invalid content: {content!r}")
+
+
+def make_elements(content: Fragment) -> List["Element"]:
+    if isinstance(content, list):
+        res = [make_element(c) for c in content]
+    else:
+        res = [make_element(content)]
+    return [c for c in res if c]
+
+
+class Element:
+    type: str
+    attrs: Dict[str, Any]
+    children: List["Element"]
+    source: Optional[str] = None
+
+    def __init__(
+        self,
+        type: Union[str, Render[Fragment, Any]],
+        attrs: Optional[Dict[str, Any]] = None,
+        *children: Fragment,
+    ) -> None:
+        self.attrs = {}
+        self.children = []
+        if attrs:
+            for k, v in attrs.items():
+                if v is None:
+                    continue
+                if k == "children":
+                    self.children.extend(ensure_list(v))
+                else:
+                    self.attrs[camel_case(k)] = v
+        for child in children:
+            self.children.extend(make_elements(child))
+        if not isinstance(type, str):
+            self.type = "component"
+            self.attrs["is"] = type
+        else:
+            self.type = type
+
+    def tag(self):
+        if self.type == "component":
+            if is_ := self.attrs.get("is"):
+                return is_.__name__
+            return "component"
+        return self.type
+
+    def attributes(self) -> str:
+        def _attr(key: str, value: Any):
+            if value is None:
+                return ""
+            key = param_case(key)
+            if value is True:
+                return f" {key}"
+            if value is False:
+                return f" no-{key}"
+            return f' {key}="{escape(str(value), True)}"'
+
+        return "".join(_attr(k, v) for k, v in self.attrs.items())
+
+    def dumps(self, strip: bool = False) -> str:
+        if self.type == "text" and "text" in self.attrs:
+            return self.attrs["text"] if strip else escape(self.attrs["text"])
+        inner = "".join(c.dumps(strip) for c in self.children)
+        if strip:
+            return inner
+        attrs = self.attributes()
+        tag = self.tag()
+        if not self.children:
+            return f"<{tag}{attrs}/>"
+        return f"<{tag}{attrs}>{inner}</{tag}>"
+
+    def __str__(self) -> str:
+        return self.dumps()
+
+    def __repr__(self) -> str:
+        return f"{self.__class__.__name__}({self.type!r}, {self.attrs!r}, {self.children!r})"
+
+
+Combinator: TypeAlias = Literal[" ", ">", "+", "~"]
+
+
+@dataclass
+class Selector:
+    type: str
+    combinator: Combinator
+
+
+comb_pat = re.compile(" *([ >+~]) *")
+
+
+def parse_selector(input: str) -> List[List[Selector]]:
+    def _quert(query: str) -> List[Selector]:
+        selectors = []
+        combinator = " "
+        while mat := comb_pat.search(query):
+            selectors.append(
+                Selector(
+                    query[: mat.start()],
+                    combinator,
+                )
+            )
+            combinator = cast(Combinator, mat.group(1))
+            query = query[mat.end() :]
+        selectors.append(Selector(query, combinator))
+        return selectors
+
+    return [_quert(q) for q in input.split(",")]
+
+
+def select(source: Union[str, List[Element]], query: Union[str, List[List[Selector]]]) -> List[Element]:
+    if not source or not query:
+        return []
+    if isinstance(source, str):
+        source = parse(source)
+    if isinstance(query, str):
+        query = parse_selector(query)
+    if not query:
+        return []
+    adjacent: List[List[Selector]] = []
+    results = []
+    for index, elem in enumerate(source):
+        inner: List[List[Selector]] = []
+        local = [*query, *adjacent]
+        adjacent = []
+        matched = False
+        for group in local:
+            type_ = group[0].type
+            combinator = group[0].combinator
+            if type_ == elem.type or type_ == "*":
+                if len(group) == 1:
+                    matched = True
+                elif group[1].combinator in (" ", ">"):
+                    inner.append(group[1:])
+                elif group[1].combinator == "+":
+                    adjacent.append(group[1:])
+                else:
+                    query.append(group[1:])
+            if combinator == " ":
+                inner.append(group)
+        if matched:
+            results.append(source[index])
+        results.extend(select(elem.children, inner))
+    return results
+
+
+def evaluate(expr: str, context: dict):
+    try:
+        return eval(expr, None, context)
+    except Exception:
+        return ""
+
+
+def interpolate(expr: str, context: dict) -> Any:
+    expr = expr.strip()
+    if not re.fullmatch(r"[\w.]+", expr):
+        ans = evaluate(expr, context)
+        return "" if ans is None else ans
+    value = context
+    for part in expr.split("."):
+        if part not in value:
+            return ""
+        value = value[part]
+        if value is None:
+            return ""
+    return "" if value is None else value
+
+
+tag_pat1 = re.compile(r"(?P<comment><!--[\s\S]*?-->)|(?P<tag><(/?)([^!\s>/]*)([^>]*?)\s*(/?)>)")
+tag_pat2 = re.compile(
+    r"(?P<comment><!--[\s\S]*?-->)|(?P<tag><(/?)([^!\s>/]*)([^>]*?)\s*(/?)>)|(?P<curly>\{(?P<derivative>[@:/#][^\s\}]*)?[\s\S]*?\})"
+)
+attr_pat1 = re.compile(r"([^\s=]+)(?:=\"(?P<value1>[^\"]*)\"|='(?P<value2>[^']*)')?", re.S)
+attr_pat2 = re.compile(
+    r"([^\s=]+)(?:=\"(?P<value1>[^\"]*)\"|='(?P<value2>[^']*)'|=\{(?P<value3>[^\}]+)\})?", re.S
+)
+
+
+class Position(IntEnum):
+    OPEN = 0
+    CLOSE = 1
+    EMPTY = 2
+    CONTINUE = 3
+
+
+@dataclass
+class Token:
+    type: Literal["angle", "curly"]
+    name: str
+    positon: Position
+    source: str
+    extra: str
+    children: Dict[str, List[Union[str, "Token"]]] = field(default_factory=dict)
+
+
+class StackItem(TypedDict):
+    token: Token
+    slot: str
+
+
+def fold_tokens(tokens: List[Union[str, Token]]) -> List[Union[str, Token]]:
+    stack: List[StackItem] = [
+        {
+            "token": Token(
+                type="angle",
+                name="template",
+                positon=Position.OPEN,
+                source="",
+                extra="",
+                children={"default": []},
+            ),
+            "slot": "default",
+        }
+    ]
+
+    def push_token(*tokens: Union[str, Token]):
+        token = stack[0]["token"]
+        token.children[stack[0]["slot"]].extend(tokens)
+
+    for token in tokens:
+        if isinstance(token, str):
+            push_token(token)
+            continue
+        if token.positon == Position.CLOSE:
+            if stack[0]["token"].name == token.name:
+                stack.pop(0)
+        elif token.positon == Position.CONTINUE:
+            stack[0]["token"].children[token.name] = []
+            stack[0]["slot"] = token.name
+        elif token.positon == Position.OPEN:
+            push_token(token)
+            token.children = {"default": []}
+            stack.insert(0, {"token": token, "slot": "default"})
+        else:
+            push_token(token)
+    return stack[-1]["token"].children["default"]
+
+
+def parse_tokens(tokens: List[Union[str, Token]], context: Optional[dict] = None) -> List[Element]:
+    result: List[Element] = []
+    for token in tokens:
+        if isinstance(token, str):
+            result.append(Element(type="text", attrs={"text": token}))
+        elif token.type == "angle":
+            attrs = {}
+            attr_pat = attr_pat2 if context is not None else attr_pat1
+            while mat := attr_pat.search(token.extra):
+                key = mat.group(1)
+                groupdict = mat.groupdict()
+                v = groupdict.get("value1") or groupdict.get("value2")
+                v3 = groupdict.get("value3")
+                if v3 and context is not None:
+                    attrs[key] = interpolate(v3, context)
+                elif v is not None:
+                    attrs[key] = unescape(v)
+                elif key.startswith("no-"):
+                    attrs[key[3:]] = False
+                else:
+                    attrs[key] = True
+                token.extra = token.extra[mat.end() :]
+            result.append(
+                Element(
+                    token.name,
+                    attrs,
+                    *parse_tokens(token.children["default"], context) if token.children else [],
+                )
+            )
+        elif not token.name:
+            result.extend(make_elements(interpolate(token.extra, context or {})))
+        elif token.name == "if":
+            if evaluate(token.extra, context or {}):
+                result.extend(parse_tokens(token.children["default"], context))
+            else:
+                result.extend(parse_tokens(token.children.get("else", []), context))
+        elif token.name == "each":
+            expr, ident = re.split(r"\s+as\s+", token.extra)
+            items = interpolate(expr, context or {})
+            if not items or not isinstance(items, Iterable):
+                continue
+            for item in items:
+                result.extend(parse_tokens(token.children["default"], {**(context or {}), ident: item}))
+    return result
+
+
+def parse(src: str, context: Optional[dict] = None):
+    tokens: List[Union[str, Token]] = []
+
+    def push_text(text: str):
+        if text:
+            tokens.append(text)
+
+    def parse_content(source: str, _start: bool, _end: bool):
+        source = unescape(source)
+        if _start:
+            source = re.sub(r"^\s*\n\s*", "", source, re.MULTILINE)
+        if _end:
+            source = re.sub(r"\s*\n\s*$", "", source, re.MULTILINE)
+        push_text(source)
+
+    tag_pat = tag_pat2 if context is not None else tag_pat1
+    strip_start = True
+
+    while tag_mat := tag_pat.search(src):
+        groupdict = tag_mat.groupdict()
+        strip_end = not bool(groupdict.get("curly"))
+        parse_content(src[: tag_mat.start()], strip_start, strip_end)
+        strip_start = strip_end
+        src = src[tag_mat.end() :]
+        groups = tag_mat.groups()
+        close, type_, extra, empty = groups[2], groups[3], groups[4], groups[5]
+        if groupdict.get("comment"):
+            continue
+        if groupdict.get("curly"):
+            name = ""
+            position = Position.EMPTY
+            if groupdict.get("derivative"):
+                name = groupdict["derivative"][1:]
+                position = {
+                    "@": Position.EMPTY,
+                    "#": Position.OPEN,
+                    "/": Position.CLOSE,
+                    ":": Position.CONTINUE,
+                }[groupdict["derivative"][0]]
+            tokens.append(
+                Token(
+                    type="curly",
+                    name=name,
+                    positon=position,
+                    source=groupdict["curly"],
+                    extra=groupdict["curly"][
+                        1 + (len(groupdict["derivative"]) if groupdict.get("derivative") else 0) : -1
+                    ],
+                )
+            )
+            continue
+        tokens.append(
+            Token(
+                type="angle",
+                name=type_ or "template",
+                positon=Position.CLOSE if close else Position.EMPTY if empty else Position.OPEN,
+                source=tag_mat[0],
+                extra=extra,
+            )
+        )
+    parse_content(src, strip_start, True)
+    return parse_tokens(fold_tokens(tokens), context)
diff --git a/nonebot/adapters/satori/event.py b/nonebot/adapters/satori/event.py
index 6f659f2..2fc0c40 100644
--- a/nonebot/adapters/satori/event.py
+++ b/nonebot/adapters/satori/event.py
@@ -8,6 +8,7 @@
 
 from nonebot.adapters import Event as BaseEvent
 
+from .element import parse
 from .models import Role, User
 from .compat import model_validator
 from .models import Event as SatoriEvent
@@ -246,10 +247,10 @@ def get_message(self) -> Message:
     @model_validator(mode="after")
     def generate_message(cls, values):
         if PYDANTIC_V2:
-            values._message = Message.from_satori_element(values.message.content)
+            values._message = Message.from_satori_element(parse(values.message.content))
             values.original_message = deepcopy(values._message)
         else:
-            values["_message"] = Message.from_satori_element(values["message"].content)
+            values["_message"] = Message.from_satori_element(parse(values["message"].content))
             values["original_message"] = deepcopy(values["_message"])
         return values
 
@@ -399,9 +400,9 @@ def get_session_id(self) -> str:
     @model_validator(mode="after")
     def generate_message(cls, values):
         if PYDANTIC_V2:
-            values._message = Message.from_satori_element(values.message.content)
+            values._message = Message.from_satori_element(parse(values.message.content))
         else:
-            values["_message"] = Message.from_satori_element(values["message"]["content"])
+            values["_message"] = Message.from_satori_element(parse(values["message"].cotent))
         return values
 
     @property
@@ -578,10 +579,10 @@ class InteractionCommandMessageEvent(InteractionCommandEvent):
     @model_validator(mode="after")
     def generate_message(cls, values):
         if PYDANTIC_V2:
-            values._message = Message.from_satori_element(values.message.content)
+            values._message = Message.from_satori_element(parse(values.message.content))
             values.original_message = deepcopy(values._message)
         else:
-            values["_message"] = Message.from_satori_element(values["message"].content)
+            values["_message"] = Message.from_satori_element(parse(values["message"].content))
             values["original_message"] = deepcopy(values["_message"])
         return values
 
diff --git a/nonebot/adapters/satori/message.py b/nonebot/adapters/satori/message.py
index f9c9766..42ec8cb 100644
--- a/nonebot/adapters/satori/message.py
+++ b/nonebot/adapters/satori/message.py
@@ -8,7 +8,7 @@
 from nonebot.adapters import Message as BaseMessage
 from nonebot.adapters import MessageSegment as BaseMessageSegment
 
-from .utils import Element, parse, escape
+from .element import Element, parse, escape
 
 
 class RawData(TypedDict):
diff --git a/nonebot/adapters/satori/models.py b/nonebot/adapters/satori/models.py
index bfb5f39..812573c 100644
--- a/nonebot/adapters/satori/models.py
+++ b/nonebot/adapters/satori/models.py
@@ -5,8 +5,8 @@
 from pydantic import Field, BaseModel, validator
 from nonebot.compat import PYDANTIC_V2, ConfigDict
 
+from .utils import log
 from .compat import model_validator
-from .utils import Element, log, parse
 
 
 class ChannelType(IntEnum):
@@ -188,7 +188,7 @@ class PongPayload(Payload):
 
 class InnerMessage(BaseModel):
     id: str
-    content: List[Element]
+    content: str
     channel: Optional[Channel] = None
     guild: Optional[Guild] = None
     member: Optional[InnerMember] = None
@@ -206,16 +206,6 @@ def ensure_content(cls, values):
         )
         return {**values, "content": "Unknown"}
 
-    @validator("content", pre=True)
-    def parse_content(cls, v):
-        if isinstance(v, list):
-            return v
-        if v is None:
-            return None
-        if not isinstance(v, str):
-            raise ValueError("content must be str")
-        return parse(v)
-
     @validator("created_at", pre=True)
     def parse_created_at(cls, v):
         if v is None:
diff --git a/nonebot/adapters/satori/utils.py b/nonebot/adapters/satori/utils.py
index 2068bb4..078136e 100644
--- a/nonebot/adapters/satori/utils.py
+++ b/nonebot/adapters/satori/utils.py
@@ -1,22 +1,7 @@
-import re
 from functools import partial
 from typing_extensions import ParamSpec, Concatenate
-from typing import (
-    TYPE_CHECKING,
-    Any,
-    Dict,
-    List,
-    Type,
-    Union,
-    Generic,
-    TypeVar,
-    Callable,
-    Optional,
-    Awaitable,
-    overload,
-)
+from typing import TYPE_CHECKING, Type, Generic, TypeVar, Callable, Optional, Awaitable, overload
 
-from pydantic import Field, BaseModel
 from nonebot.utils import logger_wrapper
 
 if TYPE_CHECKING:
@@ -28,125 +13,6 @@
 log = logger_wrapper("Satori")
 
 
-def escape(text: str) -> str:
-    return text.replace("&", "&amp;").replace('"', "&quot;").replace("<", "&lt;").replace(">", "&gt;")
-
-
-def unescape(text: str) -> str:
-    return text.replace("&quot;", '"').replace("&lt;", "<").replace("&gt;", ">").replace("&amp;", "&")
-
-
-class Element(BaseModel):
-    type: str
-    attrs: Dict[str, Any] = Field(default_factory=dict)
-    children: List["Element"] = Field(default_factory=list)
-    source: Optional[str] = None
-
-    def __str__(self):
-        if self.source:
-            return self.source
-        if self.type == "text":
-            return escape(self.attrs["text"])
-
-        def _attr(key: str, value: Any):
-            if value is True:
-                return key
-            if value is False:
-                return f"no-{key}"
-            if isinstance(value, (int, float)):
-                return f"{key}={value}"
-            return f'{key}="{escape(str(value))}"'
-
-        attrs = " ".join(_attr(k, v) for k, v in self.attrs.items())
-        if not self.children:
-            return f"<{self.type} {attrs}/>"
-        children = "".join(str(c) for c in self.children)
-        return f"<{self.type} {attrs}>{children}</{self.type}>"
-
-
-tag_pat = re.compile(r"<!--[\s\S]*?-->|<(/?)([^!\s>/]*)([^>]*?)\s*(/?)>")
-attr_pat = re.compile(r"([^\s=]+)(?:=\"([^\"]*)\"|='([^']*)')?", re.S)
-
-
-class Token(BaseModel):
-    type: str
-    close: str
-    empty: str
-    attrs: Dict[str, Any]
-    source: str
-
-
-def parse(src: str):
-    tokens: List[Union[Token, Element]] = []
-
-    def push_text(text: str):
-        if text:
-            tokens.append(Element(type="text", attrs={"text": text}))
-
-    def parse_content(source: str):
-        push_text(unescape(source))
-
-    while tag_map := tag_pat.search(src):
-        parse_content(src[: tag_map.start()])
-        src = src[tag_map.end() :]
-        if tag_map.group(0).startswith("<!--"):
-            continue
-        close, tag, attr_str, empty = tag_map.groups()
-        tkn = Token(
-            type=tag or "template",
-            close=close,
-            empty=empty,
-            attrs={},
-            source=tag_map.group(0),
-        )
-        while attr_map := attr_pat.search(attr_str):
-            key, value1, value2 = attr_map.groups()
-            value = value1 or value2
-            if value:
-                tkn.attrs[key] = unescape(value)
-            elif key.startswith("no-"):
-                tkn.attrs[key] = False
-            else:
-                tkn.attrs[key] = True
-            attr_str = attr_str[attr_map.end() :]
-        tokens.append(tkn)
-
-    parse_content(src)
-
-    stack = [Element(type="template")]
-
-    def rollback(i: int):
-        while i:
-            child = stack.pop(0)
-            source = stack[0].children.pop(-1)
-            stack[0].children.append(Element(type="text", attrs={"text": source}))
-            stack[0].children.extend(child.children)
-            i -= 1
-
-    for tkn in tokens:
-        if isinstance(tkn, Element):
-            stack[0].children.append(tkn)
-        elif tkn.close:
-            index = 0
-            while index < len(stack) and stack[index].type != tkn.type:
-                index += 1
-            if index == len(stack):
-                stack[0].children.append(Element(type="text", attrs={"text": tkn.source}))
-            else:
-                rollback(index)
-                elm = stack.pop(0)
-                elm.source = None
-        else:
-            elm = Element(type=tkn.type, attrs=tkn.attrs)
-            stack[0].children.append(elm)
-            if not tkn.empty:
-                elm.source = tkn.source
-                stack.insert(0, elm)
-
-    rollback(len(stack) - 1)
-    return stack[0].children
-
-
 class API(Generic[B, P, R]):
     def __init__(self, func: Callable[Concatenate[B, P], Awaitable[R]]) -> None:
         self.func = func