diff --git a/simulate_python/config.py b/simulate_python/config.py
index 55ed0431..9b8965f3 100644
--- a/simulate_python/config.py
+++ b/simulate_python/config.py
@@ -1,7 +1,9 @@
+import platform as _platform
+
 ROBOT = "go2" # Robot name, "go2", "b2", "b2w", "h1", "go2w", "g1" 
 ROBOT_SCENE = "../unitree_robots/" + ROBOT + "/scene.xml" # Robot scene
 DOMAIN_ID = 1 # Domain id
-INTERFACE = "lo" # Interface 
+INTERFACE = "lo0" if _platform.system() == "Darwin" else "lo" # Interface
 
 USE_JOYSTICK = 1 # Simulate Unitree WirelessController using a gamepad
 JOYSTICK_TYPE = "xbox" # support "xbox" and "switch" gamepad layout
diff --git a/simulate_python/sport_mujoco.py b/simulate_python/sport_mujoco.py
new file mode 100644
index 00000000..e7db0e86
--- /dev/null
+++ b/simulate_python/sport_mujoco.py
@@ -0,0 +1,609 @@
+#!/usr/bin/env python3
+"""
+Unified MuJoCo sim + WTW sport server (direct integration).
+
+Replaces running unitree_mujoco.py + sport_sim_server.py as two separate
+processes.  WTW runs directly inside the physics step — no DDS hop for
+lowstate/lowcmd, no sync issues at any real-time factor.
+
+The sport RPC is still served over DDS so go2_sport_client.py works unchanged.
+
+Usage (two terminals):
+  Terminal 1: cd src/unitree_mujoco/simulate_python
+              python sport_mujoco.py
+  Terminal 2: cd src/unitree_sdk2_python
+              python example/go2/high_level/go2_sport_client.py lo
+"""
+
+import sys
+import os
+import signal
+import json
+import time
+import threading
+import argparse
+import numpy as np
+import torch
+import mujoco
+import mujoco.viewer
+from threading import Thread
+
+_PROJECT_ROOT = os.path.abspath(os.path.join(os.path.dirname(__file__), "..", "..", ".."))
+sys.path.insert(0, os.path.join(_PROJECT_ROOT, "src", "unitree_sdk2_python"))
+
+import xml.etree.ElementTree as ET
+import cv2
+from unitree_sdk2py.core.channel import ChannelFactoryInitialize, ChannelPublisher
+from unitree_sdk2py.idl.unitree_go.msg.dds_ import LowState_
+from unitree_sdk2py.idl.default import unitree_go_msg_dds__LowState_ as LowState_default
+from unitree_sdk2py.go2.video.video_api import (
+    VIDEO_SERVICE_NAME, VIDEO_API_VERSION, VIDEO_API_ID_GETIMAGESAMPLE,
+)
+from unitree_sdk2py.rpc.server import Server
+from unitree_sdk2py.rpc.internal import RPC_ERR_SERVER_API_NOT_IMPL
+from unitree_sdk2py.go2.sport.sport_api import (
+    SPORT_SERVICE_NAME, SPORT_API_VERSION,
+    SPORT_API_ID_DAMP, SPORT_API_ID_BALANCESTAND, SPORT_API_ID_STOPMOVE,
+    SPORT_API_ID_STANDUP, SPORT_API_ID_STANDDOWN, SPORT_API_ID_RECOVERYSTAND,
+    SPORT_API_ID_EULER, SPORT_API_ID_MOVE, SPORT_API_ID_SIT, SPORT_API_ID_RISESIT,
+    SPORT_API_ID_SPEEDLEVEL, SPORT_API_ID_HELLO, SPORT_API_ID_STRETCH,
+    SPORT_API_ID_CONTENT, SPORT_API_ID_DANCE1, SPORT_API_ID_DANCE2,
+    SPORT_API_ID_SWITCHJOYSTICK, SPORT_API_ID_POSE, SPORT_API_ID_SCRAPE,
+    SPORT_API_ID_FRONTFLIP, SPORT_API_ID_FRONTJUMP, SPORT_API_ID_FRONTPOUNCE,
+    SPORT_API_ID_HEART, SPORT_API_ID_STATICWALK, SPORT_API_ID_TROTRUN,
+    SPORT_API_ID_ECONOMICGAIT, SPORT_API_ID_LEFTFLIP, SPORT_API_ID_BACKFLIP,
+    SPORT_API_ID_HANDSTAND, SPORT_API_ID_FREEWALK, SPORT_API_ID_FREEBOUND,
+    SPORT_API_ID_FREEJUMP, SPORT_API_ID_FREEAVOID, SPORT_API_ID_CLASSICWALK,
+    SPORT_API_ID_WALKUPRIGHT, SPORT_API_ID_CROSSSTEP,
+    SPORT_API_ID_AUTORECOVERY_SET, SPORT_API_ID_AUTORECOVERY_GET,
+    SPORT_API_ID_SWITCHAVOIDMODE,
+)
+
+import config
+from wtw_controller import WalkTheseWaysController, DEFAULT_JOINT_ANGLES_WTW, WTW_TO_MUJOCO_CTRL
+
+# ---------------------------------------------------------------------------
+# Stand poses (ctrl order: FR, FL, RR, RL)
+# ---------------------------------------------------------------------------
+_WTW_STAND_POS = np.zeros(12, dtype=np.float64)
+for _i in range(12):
+    _WTW_STAND_POS[WTW_TO_MUJOCO_CTRL[_i]] = DEFAULT_JOINT_ANGLES_WTW[_i]
+STAND_UP_POS = _WTW_STAND_POS
+
+STAND_DOWN_POS = np.array([
+     0.0473455,  1.22187, -2.44375,   # FR
+    -0.0473455,  1.22187, -2.44375,   # FL
+     0.0473455,  1.22187, -2.44375,   # RR
+    -0.0473455,  1.22187, -2.44375,   # RL
+], dtype=np.float64)
+
+TRANSITION_DURATION = 2.0   # seconds (tanh ramp)
+WTW_HZ = 50                 # target WTW policy rate
+
+# Derived at import time — adapts if config.SIMULATE_DT changes
+WTW_STEP_EVERY    = max(1, round(1.0 / (WTW_HZ * config.SIMULATE_DT)))
+IDLE_SETTLE_TICKS = round(0.5 / config.SIMULATE_DT)
+
+
+# ---------------------------------------------------------------------------
+# WTW controller — reads directly from MuJoCo sensordata
+# ---------------------------------------------------------------------------
+class SportDirectController(WalkTheseWaysController):
+
+    def step_from_mujoco(
+        self,
+        sensordata: np.ndarray,
+        num_motor: int,
+        dim_motor_sensor: int,
+        commands: np.ndarray,
+    ) -> np.ndarray:
+        """
+        Run one WTW policy step from MuJoCo sensordata.
+
+        sensordata layout (same as UnitreeSdk2Bridge.PublishLowState):
+          [0 : num_motor]              joint q   (ctrl order)
+          [num_motor : 2*num_motor]    joint dq  (ctrl order)
+          [dim_motor_sensor + 0 : +4]  IMU quaternion [w, x, y, z]
+
+        Returns target joint positions in ctrl order (FR, FL, RR, RL).
+        """
+        joint_pos_ctrl = sensordata[:num_motor]
+        joint_vel_ctrl = sensordata[num_motor : 2 * num_motor]
+        quat = sensordata[dim_motor_sensor : dim_motor_sensor + 4].astype(np.float32)
+
+        # Reorder from ctrl order (FR,FL,RR,RL) → WTW order (FL,FR,RL,RR)
+        joint_pos_wtw = np.array(
+            [joint_pos_ctrl[WTW_TO_MUJOCO_CTRL[i]] for i in range(12)],
+            dtype=np.float32,
+        )
+        joint_vel_wtw = np.array(
+            [joint_vel_ctrl[WTW_TO_MUJOCO_CTRL[i]] for i in range(12)],
+            dtype=np.float32,
+        )
+
+        obs = self._build_obs_arrays(quat, joint_pos_wtw, joint_vel_wtw, commands)
+        self.update_history(obs)
+
+        with torch.no_grad():
+            latent = self.adaptation_module(self.obs_history)
+            action = self.body(torch.cat([self.obs_history, latent], dim=1))
+
+        self.last_actions = self.actions.clone()
+        self.actions = action[0].clone()
+
+        scaled = action[0].numpy() * self.action_scale
+        scaled[[0, 3, 6, 9]] *= self.hip_scale_reduction
+        target_pos_wtw = scaled + DEFAULT_JOINT_ANGLES_WTW
+
+        self.gait_index = (self.gait_index + self.dt * commands[4]) % 1.0
+
+        target_ctrl = np.zeros(12, dtype=np.float64)
+        for i in range(12):
+            target_ctrl[WTW_TO_MUJOCO_CTRL[i]] = target_pos_wtw[i]
+        return target_ctrl
+
+    def _build_obs_arrays(self, quat, joint_pos_wtw, joint_vel_wtw, commands):
+        obs = np.zeros(self.num_obs, dtype=np.float32)
+        obs[0:3]   = self.get_gravity_vector(quat)
+        obs[3:18]  = commands * self.commands_scale
+        obs[18:30] = (joint_pos_wtw - DEFAULT_JOINT_ANGLES_WTW) * self.obs_scales["dof_pos"]
+        obs[30:42] = joint_vel_wtw * self.obs_scales["dof_vel"]
+        obs[42:54] = torch.clip(self.actions, -self.clip_actions, self.clip_actions).numpy()
+        obs[54:66] = self.last_actions.numpy()
+        obs[66:70] = self.get_clock_inputs(commands)
+        return torch.tensor(obs, dtype=torch.float32).unsqueeze(0)
+
+
+# ---------------------------------------------------------------------------
+# State machine
+# ---------------------------------------------------------------------------
+class State:
+    IDLE_CONNECTED = "idle_connected"  # settling after startup
+    STANDING       = "standing"        # WTW at zero velocity
+    STANDING_UP    = "standing_up"     # tanh transition → STAND_UP_POS
+    STANDING_DOWN  = "standing_down"   # tanh transition → STAND_DOWN_POS
+    WALKING        = "walking"         # WTW with velocity commands
+    DAMP           = "damp"            # motors off
+
+
+# ---------------------------------------------------------------------------
+# RPC server (sport commands only — no DDS lowstate/lowcmd)
+# ---------------------------------------------------------------------------
+class SportMuJoCoServer(Server):
+    """
+    Serves the sport RPC API over DDS.  State is updated by RPC handlers
+    and consumed every physics step by tick().
+    """
+
+    def __init__(self, controller: SportDirectController, num_motor: int):
+        super().__init__(SPORT_SERVICE_NAME)
+        self._controller = controller
+        self._num_motor  = num_motor
+
+        self._lock = threading.Lock()
+
+        # Shared state — written by RPC handlers, read by sim thread via tick()
+        self._state     = State.IDLE_CONNECTED
+        self._vx = self._vy = self._vyaw = 0.0
+
+        # Transition
+        self._transition_start_step = 0
+        self._transition_from = np.zeros(num_motor)
+        self._transition_to   = np.zeros(num_motor)
+
+        # Updated by tick() so RPC handlers can snapshot current joint pos
+        self._current_q  = np.zeros(num_motor)
+        self._sim_step   = 0
+        self._idle_start_step = 0
+
+        # Cached WTW output (ctrl order) — reused between WTW steps
+        self._last_wtw_ctrl: np.ndarray | None = None
+
+    # ------------------------------------------------------ RPC registration
+    def Init(self):
+        self._SetApiVersion(SPORT_API_VERSION)
+
+        self._RegistHandler(SPORT_API_ID_STANDUP,       self._handle_stand_up,   False)
+        self._RegistHandler(SPORT_API_ID_STANDDOWN,     self._handle_stand_down, False)
+        self._RegistHandler(SPORT_API_ID_MOVE,          self._handle_move,       False)
+        self._RegistHandler(SPORT_API_ID_STOPMOVE,      self._handle_stop_move,  False)
+        self._RegistHandler(SPORT_API_ID_DAMP,          self._handle_damp,       False)
+        self._RegistHandler(SPORT_API_ID_BALANCESTAND,  self._handle_stub,       False)
+        self._RegistHandler(SPORT_API_ID_RECOVERYSTAND, self._handle_stub,       False)
+
+        for api_id in [
+            SPORT_API_ID_EULER, SPORT_API_ID_SIT, SPORT_API_ID_RISESIT,
+            SPORT_API_ID_SPEEDLEVEL, SPORT_API_ID_HELLO, SPORT_API_ID_STRETCH,
+            SPORT_API_ID_CONTENT, SPORT_API_ID_DANCE1, SPORT_API_ID_DANCE2,
+            SPORT_API_ID_SWITCHJOYSTICK, SPORT_API_ID_POSE, SPORT_API_ID_SCRAPE,
+            SPORT_API_ID_FRONTFLIP, SPORT_API_ID_FRONTJUMP, SPORT_API_ID_FRONTPOUNCE,
+            SPORT_API_ID_HEART, SPORT_API_ID_STATICWALK, SPORT_API_ID_TROTRUN,
+            SPORT_API_ID_ECONOMICGAIT, SPORT_API_ID_LEFTFLIP, SPORT_API_ID_BACKFLIP,
+            SPORT_API_ID_HANDSTAND, SPORT_API_ID_FREEWALK, SPORT_API_ID_FREEBOUND,
+            SPORT_API_ID_FREEJUMP, SPORT_API_ID_FREEAVOID, SPORT_API_ID_CLASSICWALK,
+            SPORT_API_ID_WALKUPRIGHT, SPORT_API_ID_CROSSSTEP,
+            SPORT_API_ID_AUTORECOVERY_SET, SPORT_API_ID_AUTORECOVERY_GET,
+            SPORT_API_ID_SWITCHAVOIDMODE,
+        ]:
+            self._RegistHandler(api_id, self._handle_not_impl, False)
+
+    # --------------------------------------------------------- RPC handlers
+    def _handle_stand_up(self, parameter: str):
+        with self._lock:
+            self._transition_from = self._current_q.copy()
+            self._transition_to   = STAND_UP_POS.copy()
+            self._transition_start_step = self._sim_step
+            self._state = State.STANDING_UP
+            self._controller.reset()
+            print("[sport_mujoco] StandUp")
+        return 0, ""
+
+    def _handle_stand_down(self, parameter: str):
+        with self._lock:
+            self._transition_from = self._current_q.copy()
+            self._transition_to   = STAND_DOWN_POS.copy()
+            self._transition_start_step = self._sim_step
+            self._state = State.STANDING_DOWN
+            print("[sport_mujoco] StandDown")
+        return 0, ""
+
+    def _handle_move(self, parameter: str):
+        p = json.loads(parameter)
+        with self._lock:
+            self._vx   = float(p.get("x", 0.0))
+            self._vy   = float(p.get("y", 0.0))
+            self._vyaw = float(p.get("z", 0.0))
+            self._state = State.WALKING
+            print(f"[sport_mujoco] Move vx={self._vx:.2f} vy={self._vy:.2f} vyaw={self._vyaw:.2f}")
+        return 0, ""
+
+    def _handle_stop_move(self, parameter: str):
+        with self._lock:
+            self._vx = self._vy = self._vyaw = 0.0
+            print("[sport_mujoco] StopMove")
+        return 0, ""
+
+    def _handle_damp(self, parameter: str):
+        with self._lock:
+            self._state = State.DAMP
+            print("[sport_mujoco] Damp")
+        return 0, ""
+
+    def _handle_stub(self, _):
+        return 0, ""
+
+    def _handle_not_impl(self, _):
+        return RPC_ERR_SERVER_API_NOT_IMPL, ""
+
+    # ----------------------------------------- called by sim thread each step
+    def tick(self, sensordata: np.ndarray, num_motor: int, dim_motor_sensor: int) -> None:
+        """
+        Compute and write mj_data.ctrl for the current physics step.
+
+        Called inside the sim loop (under the mujoco lock) on every step.
+        Writes ctrl via the provided setter to keep mj_data out of this class.
+        Returns (ctrl_target, kp, kd) so the caller can apply them.
+        """
+        with self._lock:
+            step  = self._sim_step
+            state = self._state
+            vx, vy, vyaw = self._vx, self._vy, self._vyaw
+            t_start = self._transition_start_step
+            t_from  = self._transition_from
+            t_to    = self._transition_to
+
+            # Keep current_q fresh so RPC handlers can snapshot it
+            self._current_q = sensordata[:num_motor].copy()
+            self._sim_step += 1
+
+        ctrl_target = self._current_q.copy()
+        kp, kd = 50.0, 3.5
+
+        if state == State.IDLE_CONNECTED:
+            if step - self._idle_start_step >= IDLE_SETTLE_TICKS:
+                with self._lock:
+                    self._controller.reset()
+                    self._state = State.STANDING
+                print("[sport_mujoco] Standing complete.")
+            # Hold keyframe during settle — ctrl_target already = current_q
+
+        elif state == State.DAMP:
+            kp, kd = 0.0, 2.0
+
+        elif state in (State.STANDING_UP, State.STANDING_DOWN):
+            elapsed = (step - t_start) * config.SIMULATE_DT
+            phase   = float(np.tanh(elapsed / TRANSITION_DURATION))
+            ctrl_target = (1.0 - phase) * t_from + phase * t_to
+            kp = phase * 50.0 + (1.0 - phase) * 20.0
+            if phase >= 0.99:
+                with self._lock:
+                    self._state = (
+                        State.STANDING if state == State.STANDING_UP else State.IDLE_CONNECTED
+                    )
+                print(f"[sport_mujoco] Transition done → {self._state}")
+                if state == State.STANDING_UP:
+                    print("[sport_mujoco] Standing complete.")
+
+        elif state in (State.STANDING, State.WALKING):
+            v = (vx, vy, vyaw) if state == State.WALKING else (0.0, 0.0, 0.0)
+            if step % WTW_STEP_EVERY == 0:
+                commands = self._controller.get_commands(*v)
+                self._last_wtw_ctrl = self._controller.step_from_mujoco(
+                    sensordata, num_motor, dim_motor_sensor, commands
+                )
+            if self._last_wtw_ctrl is not None:
+                ctrl_target = self._last_wtw_ctrl
+            kp = self._controller.stiffness
+            kd = self._controller.damping
+
+        return ctrl_target, kp, kd
+
+
+# ---------------------------------------------------------------------------
+# Video RPC server — serves the "videohub" API used by camera_opencv.py
+# ---------------------------------------------------------------------------
+CAMERA_HZ = 30  # render rate (Hz)
+
+class VideoSimServer(Server):
+    """Serves GetImageSample RPC with frames rendered from the MuJoCo camera."""
+
+    def __init__(self):
+        super().__init__(VIDEO_SERVICE_NAME)
+        # Workaround: SDK bug initializes __apiBinarySet as {} instead of set()
+        self._Server__apiBinarySet = set()
+        self._lock = threading.Lock()
+        self._latest_jpeg: bytes = b""
+
+    def Init(self):
+        self._SetApiVersion(VIDEO_API_VERSION)
+        self._RegistBinaryHandler(VIDEO_API_ID_GETIMAGESAMPLE, self._handle_get_image, False)
+
+    def update_frame(self, jpeg_bytes: bytes):
+        with self._lock:
+            self._latest_jpeg = jpeg_bytes
+
+    def _handle_get_image(self, _parameter_binary):
+        with self._lock:
+            data = list(self._latest_jpeg)
+        return 0, data
+
+
+def _load_scene(scene_path):
+    """Load a scene XML that may live outside the go2 robot directory.
+    Rewrites <include> paths and writes a temp file next to go2.xml so MuJoCo
+    resolves meshdir and asset paths correctly."""
+    scene_path = os.path.abspath(scene_path)
+    scene_dir  = os.path.dirname(scene_path)
+    go2_dir    = os.path.normpath(
+        os.path.join(os.path.dirname(__file__), "..", "unitree_robots", "go2"))
+
+    if scene_dir == go2_dir:
+        return mujoco.MjModel.from_xml_path(scene_path)
+
+    tree = ET.parse(scene_path)
+    root = tree.getroot()
+    for elem in root.iter():
+        rel = elem.get("file", "")
+        if rel and not os.path.isabs(rel):
+            elem.set("file", os.path.normpath(os.path.join(scene_dir, rel)))
+
+    tmp = os.path.join(go2_dir, "_tmp_scene.xml")
+    try:
+        tree.write(tmp, encoding="unicode", xml_declaration=False)
+        return mujoco.MjModel.from_xml_path(tmp)
+    finally:
+        if os.path.exists(tmp):
+            os.remove(tmp)
+
+
+# ---------------------------------------------------------------------------
+# Entry point
+# ---------------------------------------------------------------------------
+def main():
+    parser = argparse.ArgumentParser(description="Unified MuJoCo sim + WTW sport server")
+    parser.add_argument("--interface", default=config.INTERFACE)
+    parser.add_argument("--domain",    default=config.DOMAIN_ID, type=int)
+    parser.add_argument("--scene",     default=config.ROBOT_SCENE,
+                        help="Path to MuJoCo scene XML (default: config.ROBOT_SCENE)")
+    parser.add_argument("--headless",  action="store_true", help="Run without viewer")
+    parser.add_argument("--record",    metavar="PATH",       default=None,
+                        help="Save spectator-view recording to PATH (e.g. run.mp4)")
+    parser.add_argument("--telemetry", metavar="PATH",       default=None,
+                        help="Write simulation state snapshots to PATH (JSON)")
+    _WTW_DIR = os.path.join(os.path.dirname(__file__), "wtw")
+    parser.add_argument("--model-dir", default=_WTW_DIR)
+    parser.add_argument("--cfg-path",  default=os.path.join(_WTW_DIR, "parameters_cpu.pkl"))
+    args = parser.parse_args()
+
+    # --- MuJoCo setup -------------------------------------------------------
+    mj_model = _load_scene(args.scene)
+    mj_data  = mujoco.MjData(mj_model)
+    mujoco.mj_resetDataKeyframe(mj_model, mj_data, 0)
+    mj_model.opt.timestep = config.SIMULATE_DT
+
+    num_motor        = mj_model.nu
+    dim_motor_sensor = 3 * num_motor  # q, dq, tau_est per motor
+
+    # --- Controller + RPC servers -------------------------------------------
+    controller = SportDirectController(args.model_dir, args.cfg_path)
+    server = SportMuJoCoServer(controller, num_motor)
+
+    cam_id = mujoco.mj_name2id(mj_model, mujoco.mjtObj.mjOBJ_CAMERA, "front_camera")
+    has_camera = cam_id >= 0
+    if has_camera:
+        camera_step_every = max(1, round(1.0 / (CAMERA_HZ * config.SIMULATE_DT)))
+        video_server = VideoSimServer()
+    else:
+        print("[sport_mujoco] WARNING: 'front_camera' not found in model — video API disabled")
+    # Renderer is created lazily on first _step() call so it shares the calling
+    # thread's OpenGL/EGL context (creating it on the main thread and using it
+    # from SimulationThread would cause context-mismatch → garbage frames).
+    camera_renderer: mujoco.Renderer | None = None
+
+    # --- Recording setup ----------------------------------------------------
+    RECORD_HZ = 30
+    RECORD_W, RECORD_H = 1280, 720
+    record_renderer: mujoco.Renderer | None = None
+    record_ffmpeg = None  # subprocess.Popen piping raw RGB to ffmpeg
+    record_cam    = None  # MjvCamera tracking the robot
+    if args.record:
+        record_cam = mujoco.MjvCamera()
+        record_cam.type       = mujoco.mjtCamera.mjCAMERA_TRACKING
+        record_cam.trackbodyid = mj_model.body("base_link").id
+        record_cam.distance   = 3.0
+        record_cam.elevation  = -30.0
+        record_cam.azimuth    = 135.0
+        record_step_every = max(1, round(1.0 / (RECORD_HZ * config.SIMULATE_DT)))
+        print(f"[sport_mujoco] Recording to {args.record} @ {RECORD_HZ} Hz")
+
+    # --- Telemetry setup ----------------------------------------------------
+    TELEMETRY_HZ = 10  # snapshots per simulated second
+    telemetry_step_every = max(1, round(1.0 / (TELEMETRY_HZ * config.SIMULATE_DT)))
+    telemetry_file = open(args.telemetry, "w") if args.telemetry else None
+
+    print(f"[sport_mujoco] DDS domain={args.domain} interface={args.interface}")
+    ChannelFactoryInitialize(args.domain, args.interface)
+    server.Init()
+    server.Start()
+    if has_camera:
+        video_server.Init()
+        video_server.Start()
+        print(f"[sport_mujoco] Video RPC serving (front_camera @ {CAMERA_HZ} Hz)")
+
+    # --- lowstate publisher (re-enables record_joints.py and other subscribers)
+    low_state     = LowState_default()
+    low_state_pub = ChannelPublisher("rt/lowstate", LowState_)
+    low_state_pub.Init()
+    print("[sport_mujoco] Serving sport RPC.")
+    print(f"[sport_mujoco] WTW every {WTW_STEP_EVERY} steps → {WTW_HZ} Hz sim-time")
+
+    # --- Sim loop -----------------------------------------------------------
+    _sim_step_count = 0
+
+    def _step():
+        nonlocal _sim_step_count, camera_renderer, record_renderer, record_ffmpeg
+        # Lazily create renderers on the first call so they belong to this thread's
+        # OpenGL/EGL context (avoids garbage frames from context mismatch).
+        if has_camera and camera_renderer is None:
+            camera_renderer = mujoco.Renderer(mj_model, height=480, width=640)
+            print("[sport_mujoco] Camera renderer initialised on sim thread.")
+        if args.record and record_renderer is None:
+            record_renderer = mujoco.Renderer(mj_model, height=RECORD_H, width=RECORD_W)
+            record_ffmpeg = __import__("subprocess").Popen([
+                "ffmpeg", "-y",
+                "-f", "rawvideo", "-vcodec", "rawvideo",
+                "-s", f"{RECORD_W}x{RECORD_H}",
+                "-pix_fmt", "rgb24",
+                "-r", str(RECORD_HZ),
+                "-i", "pipe:",
+                "-vcodec", "libx264",
+                "-pix_fmt", "yuv420p",
+                "-preset", "fast",
+                "-movflags", "+faststart",
+                args.record,
+            ], stdin=__import__("subprocess").PIPE, stderr=__import__("subprocess").DEVNULL)
+            print(f"[sport_mujoco] Record renderer initialised on sim thread.")
+        ctrl_target, kp, kd = server.tick(mj_data.sensordata, num_motor, dim_motor_sensor)
+        for i in range(num_motor):
+            q  = mj_data.sensordata[i]
+            dq = mj_data.sensordata[num_motor + i]
+            mj_data.ctrl[i] = kp * (ctrl_target[i] - q) + kd * (-dq)
+        mujoco.mj_step(mj_model, mj_data)
+        for i in range(num_motor):
+            low_state.motor_state[i].q       = mj_data.sensordata[i]
+            low_state.motor_state[i].dq      = mj_data.sensordata[num_motor + i]
+            low_state.motor_state[i].tau_est = mj_data.sensordata[2 * num_motor + i]
+        low_state.imu_state.quaternion[0] = mj_data.sensordata[dim_motor_sensor]
+        low_state.imu_state.quaternion[1] = mj_data.sensordata[dim_motor_sensor + 1]
+        low_state.imu_state.quaternion[2] = mj_data.sensordata[dim_motor_sensor + 2]
+        low_state.imu_state.quaternion[3] = mj_data.sensordata[dim_motor_sensor + 3]
+        low_state_pub.Write(low_state)
+        if has_camera and _sim_step_count % camera_step_every == 0:
+            camera_renderer.update_scene(mj_data, camera=cam_id)
+            rgb = camera_renderer.render()
+            # Normalise: renderer returns uint8 [0,255] in modern mujoco
+            if rgb.dtype != np.uint8:
+                rgb = (np.clip(rgb, 0.0, 1.0) * 255).astype(np.uint8)
+            # Drop alpha channel if renderer returned RGBA
+            if rgb.ndim == 3 and rgb.shape[2] == 4:
+                rgb = rgb[:, :, :3]
+            ok, jpeg = cv2.imencode(".jpg", cv2.cvtColor(rgb, cv2.COLOR_RGB2BGR))
+            if ok:
+                jpeg_bytes = jpeg.tobytes()
+                if _sim_step_count == 0:  # save very first frame for inspection
+                    cv2.imwrite("/tmp/sport_mujoco_frame0.jpg", cv2.cvtColor(rgb, cv2.COLOR_RGB2BGR))
+                    print(f"[camera] first frame: shape={rgb.shape} dtype={rgb.dtype} "
+                          f"min={rgb.min()} max={rgb.max()} mean={rgb.mean():.1f} "
+                          f"JPEG={len(jpeg_bytes)} bytes → /tmp/sport_mujoco_frame0.jpg")
+                video_server.update_frame(jpeg_bytes)
+        if args.record and record_ffmpeg is not None and _sim_step_count % record_step_every == 0:
+            record_renderer.update_scene(mj_data, camera=record_cam)
+            frame = record_renderer.render()
+            if frame.dtype != np.uint8:
+                frame = (np.clip(frame, 0.0, 1.0) * 255).astype(np.uint8)
+            if frame.ndim == 3 and frame.shape[2] == 4:
+                frame = frame[:, :, :3]
+            try:
+                record_ffmpeg.stdin.write(frame.tobytes())
+            except (ValueError, BrokenPipeError):
+                pass
+        if telemetry_file is not None and _sim_step_count % telemetry_step_every == 0:
+            import json as _json
+            snapshot = {
+                "t":    round(mj_data.time, 4),
+                "qpos": mj_data.qpos.tolist(),
+                "qvel": mj_data.qvel.tolist(),
+            }
+            telemetry_file.write(_json.dumps(snapshot) + "\n")
+            telemetry_file.flush()
+        _sim_step_count += 1
+
+    try:
+        if args.headless:
+            print("[sport_mujoco] Running headless.")
+            while True:
+                t0 = time.perf_counter()
+                _step()
+                dt_left = config.SIMULATE_DT - (time.perf_counter() - t0)
+                if dt_left > 0:
+                    time.sleep(dt_left)
+        else:
+            viewer = mujoco.viewer.launch_passive(mj_model, mj_data)
+            time.sleep(0.2)
+            locker = threading.Lock()
+
+            def SimulationThread():
+                while viewer.is_running():
+                    t0 = time.perf_counter()
+                    with locker:
+                        _step()
+                    dt_left = config.SIMULATE_DT - (time.perf_counter() - t0)
+                    if dt_left > 0:
+                        time.sleep(dt_left)
+
+            def PhysicsViewerThread():
+                while viewer.is_running():
+                    with locker:
+                        viewer.sync()
+                    time.sleep(config.VIEWER_DT)
+
+            sim_thread    = Thread(target=SimulationThread,    daemon=True)
+            viewer_thread = Thread(target=PhysicsViewerThread, daemon=True)
+            sim_thread.start()
+            viewer_thread.start()
+            sim_thread.join()
+    finally:
+        if telemetry_file is not None:
+            telemetry_file.close()
+            print(f"[sport_mujoco] Telemetry saved: {args.telemetry}")
+        if record_ffmpeg is not None:
+            record_ffmpeg.stdin.close()
+            record_ffmpeg.wait()
+            print(f"[sport_mujoco] Recording saved: {args.record}")
+
+
+if __name__ == "__main__":
+    # Convert SIGTERM → SystemExit so try/finally (e.g. record_writer.release())
+    # runs when the parent process terminates us cleanly.
+    signal.signal(signal.SIGTERM, lambda *_: sys.exit(0))
+    main()
diff --git a/simulate_python/wtw_controller.py b/simulate_python/wtw_controller.py
new file mode 100644
index 00000000..10899fc7
--- /dev/null
+++ b/simulate_python/wtw_controller.py
@@ -0,0 +1,160 @@
+"""
+Walk-These-Ways locomotion policy controller for the Go2 robot.
+
+Loads pre-trained TorchScript checkpoints and exposes a step() interface
+compatible with both the MuJoCo direct-integration (sport_mujoco.py) and
+the standalone demo (go2_wtw_demo.py).
+"""
+
+import io
+import pickle
+
+import mujoco
+import numpy as np
+import torch
+
+
+class CPUUnpickler(pickle.Unpickler):
+    """Unpickler that maps CUDA tensors to CPU."""
+    def find_class(self, module, name):
+        if module == "torch.storage" and name == "_load_from_bytes":
+            return lambda b: torch.load(io.BytesIO(b), map_location="cpu", weights_only=False)
+        return super().find_class(module, name)
+
+
+# Maps WTW joint indices → MuJoCo ctrl indices (different ordering)
+# 4 legs × 3 joints: Hip, Thigh, Calf
+WTW_TO_MUJOCO_CTRL = [3, 4, 5, 0, 1, 2, 9, 10, 11, 6, 7, 8]
+
+# Default joint angles in WTW order (standing pose)
+DEFAULT_JOINT_ANGLES_WTW = np.array([
+    0.1,  0.8, -1.5,   # FL
+   -0.1,  0.8, -1.5,   # FR
+    0.1,  1.0, -1.5,   # RL
+   -0.1,  1.0, -1.5,   # RR
+], dtype=np.float32)
+
+
+class WalkTheseWaysController:
+    def __init__(self, model_dir: str, cfg_path: str):
+        with open(cfg_path, "rb") as f:
+            pkl_cfg = CPUUnpickler(f).load()
+        self.cfg = pkl_cfg["Cfg"]
+
+        self.body              = torch.jit.load(f"{model_dir}/body_latest.jit",              map_location="cpu")
+        self.adaptation_module = torch.jit.load(f"{model_dir}/adaptation_module_latest.jit", map_location="cpu")
+        self.body.eval()
+        self.adaptation_module.eval()
+
+        self.num_obs      = self.cfg["env"]["num_observations"]       # 70
+        self.num_hist     = self.cfg["env"]["num_observation_history"] # 30
+        self.num_actions  = self.cfg["env"]["num_actions"]             # 12
+        self.num_commands = self.cfg["commands"]["num_commands"]        # 15
+
+        self.obs_scales        = self.cfg["obs_scales"]
+        self.clip_actions      = self.cfg["normalization"]["clip_actions"]
+        self.action_scale      = self.cfg["control"]["action_scale"]
+        self.hip_scale_reduction = self.cfg["control"]["hip_scale_reduction"]
+        self.stiffness         = self.cfg["control"]["stiffness"]["joint"]
+        self.damping           = self.cfg["control"]["damping"]["joint"]
+
+        self.commands_scale = np.array([
+            self.obs_scales["lin_vel"],           # 0: lin_vel_x
+            self.obs_scales["lin_vel"],           # 1: lin_vel_y
+            self.obs_scales["ang_vel"],           # 2: ang_vel_yaw
+            self.obs_scales["body_height_cmd"],   # 3: body height
+            1.0,                                  # 4: gait freq
+            1.0,                                  # 5: gait phase
+            1.0,                                  # 6: gait offset
+            1.0,                                  # 7: gait bound
+            1.0,                                  # 8: gait duration
+            self.obs_scales["footswing_height_cmd"], # 9
+            self.obs_scales["body_pitch_cmd"],    # 10
+            self.obs_scales["body_roll_cmd"],     # 11
+            self.obs_scales["stance_width_cmd"],  # 12
+            self.obs_scales["stance_length_cmd"], # 13
+            self.obs_scales["aux_reward_cmd"],    # 14
+        ], dtype=np.float32)
+
+        self.obs_history  = torch.zeros(1, self.num_obs * self.num_hist, dtype=torch.float32)
+        self.actions      = torch.zeros(self.num_actions, dtype=torch.float32)
+        self.last_actions = torch.zeros(self.num_actions, dtype=torch.float32)
+        self.gait_index   = 0.0
+        self.dt           = 0.02  # 50 Hz control
+
+        print(f"Loaded Walk-These-Ways policy:")
+        print(f"  num_obs: {self.num_obs}, num_hist: {self.num_hist}")
+        print(f"  action_scale: {self.action_scale}, hip_scale: {self.hip_scale_reduction}")
+        print(f"  stiffness: {self.stiffness}, damping: {self.damping}")
+
+    # ------------------------------------------------------------------
+    def get_gravity_vector(self, quat: np.ndarray) -> np.ndarray:
+        """Project world gravity [0,0,-1] into body frame. quat: [w,x,y,z]."""
+        w, x, y, z = quat
+        R = np.array([
+            [1 - 2*(y*y + z*z),  2*(x*y - z*w),      2*(x*z + y*w)],
+            [2*(x*y + z*w),      1 - 2*(x*x + z*z),  2*(y*z - x*w)],
+            [2*(x*z - y*w),      2*(y*z + x*w),      1 - 2*(x*x + y*y)],
+        ], dtype=np.float32)
+        return R.T @ np.array([0, 0, -1], dtype=np.float32)
+
+    def get_clock_inputs(self, commands: np.ndarray) -> np.ndarray:
+        phases, offsets, bounds = commands[5], commands[6], commands[7]
+        foot_indices = [
+            self.gait_index + phases + offsets + bounds,
+            self.gait_index + offsets,
+            self.gait_index + bounds,
+            self.gait_index + phases,
+        ]
+        return np.array([np.sin(2 * np.pi * fi) for fi in foot_indices], dtype=np.float32)
+
+    def get_commands(self, vx: float = 0.0, vy: float = 0.0, vyaw: float = 0.0) -> np.ndarray:
+        commands = np.zeros(self.num_commands, dtype=np.float32)
+        commands[0] = vx
+        commands[1] = vy
+        commands[2] = vyaw
+        commands[4] = 3.0   # gait frequency
+        commands[5] = 0.5   # phase
+        commands[8] = 0.5   # duration
+        commands[9] = 0.08  # footswing height
+        return commands
+
+    def update_history(self, obs: torch.Tensor):
+        self.obs_history = torch.roll(self.obs_history, -self.num_obs, dims=1)
+        self.obs_history[0, -self.num_obs:] = obs[0]
+
+    def build_observation(self, data: mujoco.MjData, commands: np.ndarray) -> torch.Tensor:
+        """Build 70-dim observation from MjData (uses qpos/qvel directly)."""
+        obs = np.zeros(self.num_obs, dtype=np.float32)
+        quat      = data.qpos[3:7]
+        joint_pos = data.qpos[7:19]
+        joint_vel = data.qvel[6:18]
+        obs[0:3]   = self.get_gravity_vector(quat)
+        obs[3:18]  = commands * self.commands_scale
+        obs[18:30] = (joint_pos - DEFAULT_JOINT_ANGLES_WTW) * self.obs_scales["dof_pos"]
+        obs[30:42] = joint_vel * self.obs_scales["dof_vel"]
+        obs[42:54] = torch.clip(self.actions, -self.clip_actions, self.clip_actions).numpy()
+        obs[54:66] = self.last_actions.numpy()
+        obs[66:70] = self.get_clock_inputs(commands)
+        return torch.tensor(obs, dtype=torch.float32).unsqueeze(0)
+
+    def step(self, data: mujoco.MjData, commands: np.ndarray) -> np.ndarray:
+        """Run one policy step; returns target joint positions in WTW order."""
+        obs = self.build_observation(data, commands)
+        self.update_history(obs)
+        with torch.no_grad():
+            latent = self.adaptation_module(self.obs_history)
+            action = self.body(torch.cat([self.obs_history, latent], dim=1))
+        self.last_actions = self.actions.clone()
+        self.actions = action[0].clone()
+        scaled = action[0].numpy() * self.action_scale
+        scaled[[0, 3, 6, 9]] *= self.hip_scale_reduction
+        target_pos_wtw = scaled + DEFAULT_JOINT_ANGLES_WTW
+        self.gait_index = (self.gait_index + self.dt * commands[4]) % 1.0
+        return target_pos_wtw
+
+    def reset(self):
+        self.obs_history.zero_()
+        self.actions.zero_()
+        self.last_actions.zero_()
+        self.gait_index = 0.0
diff --git a/unitree_robots/go2/go2.xml b/unitree_robots/go2/go2.xml
index d970540c..aa99ad0c 100644
--- a/unitree_robots/go2/go2.xml
+++ b/unitree_robots/go2/go2.xml
@@ -75,6 +75,8 @@
       <geom size="0.05 0.045" pos="0.285 0 0.01" type="cylinder" class="collision" />
       <geom size="0.047" pos="0.293 0 -0.06" class="collision" />
       <site name="imu" pos="-0.02557 0 0.04232" />
+      <!-- Front camera approx matching Go2 RealSense D435i position, tilted 15° down -->
+      <camera name="front_camera" pos="0.40 0 0.05" xyaxes="0 -1 0 0.259 0 0.966" fovy="60"/>
       <body name="FL_hip" pos="0.1934 0.0465 0">
         <inertial pos="-0.0054 0.00194 -0.000105" quat="0.497014 0.499245 0.505462 0.498237"
           mass="0.678"